独学でプログラミングとかやってみる 〜ITとかの勉強レポート〜

ボクが勉強したプログラミングやIT関連の情報を記事にしていきます。機械学習や深層学習なども取り扱います。

2018-04-15から1日間の記事一覧

Q-NetworkでOpenAI Gymに挑戦!

Q-Networkに挑戦してみる 強化学習のQ-NetworkでOpenAI Gymのフローズンレイクに挑戦します。 目標は前回までのQラーニングよりさらにゲームが上手いAIを作ることです。 Q-Networkについて簡単に説明しておきます。 ステートと重みをかけ合わせてQ値を求めま…

OpenAI Gymで強化学習!

ベルマン方程式 前回の続きです。 OpenAI GymのFrozenLake-v0を攻略して行きます。 Qテーブルを更新するのにベルマン方程式を使うので、 まずはベルマン方程式についてお話しします。 Q(s,a) = r + γ(max(Q(s',a'))) Q:行動価値関数 s:state a,:action r…