ichou1のブログ

主に音声認識、時々、データ分析のことを書く

深層強化学習

Deep Learningを使ったWEBサービスはメモリ1GBでも動かせる

TensorFlowやPyTorchといった深層学習ライブラリを使おうとした場合、動かす環境はそれなりのスペックが必要になる。物理メモリが2GBのPCを使っていた頃、「VGG16」モデルを転移学習しようとしたらメモリに乗り切らなくて断念したことがある。トレーニングの…

機械学習の手法を俯瞰してみる

『Pythonによる深層強化学習入門』で書かれている"機械学習の種類(一例)"を参考にして作成。どの系統に属するものなのか、まとめておく。 分類 概要 手法 例 教師あり学習 入力データと、それに対する答え(教師データ)がセットになったデータを学習する …

Kerasメモ(強化学習)その3

前回の続き。DQN(Deep Q Learning)の中身について見ていく。AgentとしてDQNAgentを使う場合、指定しなければデフォルトで「Double DQN」が有効になる。 rl/agents/dqn.py class DQNAgent(AbstractDQNAgent): def __init__(self, model, policy=None, test_…

Kerasメモ(強化学習)その2

前回の続き。OpenAI gymの「CartPole-v0」(倒立振り子)を試してみる。ソースコード(keras-rl) keras-rl/dqn_cartpole.py at master · keras-rl/keras-rl · GitHubまずは、どのようなゲームなのかの確認。 ゲームオーバの条件は2つ。 「棒の角度」または…

Kerasメモ(強化学習)

Deep Reinforcement Learningを試してみる。今回、使ったソース Deep-Learning-with-Keras/rl-network-train.py at master · PacktPublishing/Deep-Learning-with-Keras · GitHubゲーム内容は、プレイヤーが「paddle」を動かして、落下してくる「ball」をキ…