深層強化学習
TensorFlowやPyTorchといった深層学習ライブラリを使おうとした場合、動かす環境はそれなりのスペックが必要になる。物理メモリが2GBのPCを使っていた頃、「VGG16」モデルを転移学習しようとしたらメモリに乗り切らなくて断念したことがある。トレーニングの…
『Pythonによる深層強化学習入門』で書かれている"機械学習の種類(一例)"を参考にして作成。どの系統に属するものなのか、まとめておく。 分類 概要 手法 例 教師あり学習 入力データと、それに対する答え(教師データ)がセットになったデータを学習する …
前回の続き。DQN(Deep Q Learning)の中身について見ていく。AgentとしてDQNAgentを使う場合、指定しなければデフォルトで「Double DQN」が有効になる。 rl/agents/dqn.py class DQNAgent(AbstractDQNAgent): def __init__(self, model, policy=None, test_…
前回の続き。OpenAI gymの「CartPole-v0」(倒立振り子)を試してみる。ソースコード(keras-rl) keras-rl/dqn_cartpole.py at master · keras-rl/keras-rl · GitHubまずは、どのようなゲームなのかの確認。 ゲームオーバの条件は2つ。 「棒の角度」または…
Deep Reinforcement Learningを試してみる。今回、使ったソース Deep-Learning-with-Keras/rl-network-train.py at master · PacktPublishing/Deep-Learning-with-Keras · GitHubゲーム内容は、プレイヤーが「paddle」を動かして、落下してくる「ball」をキ…