フルスクラッチで単回帰分析をやってみる

python AI 機械学習

機械学習の理解を深める Pythonにはsklearnという便利な機械学習ライブラリがあります。ただ、内部の計算に触れることは大事だと思うのです。というわけで今回は単回帰分析をsklearnを使わずに実装します。計算の準備計算式の確認をします。単回帰なの…

2018-04-17

TensorFlowでMNISTを使ってみる

AI python 人工知能

今回やったこと TensorFlowのチュートリアルを今回やってみました。 MNISTというかなり有名な数字画像の識別問題をやってみます。どうやったか？チュートリアルに倣ってsoftmaxと勾配降下法を使いました。ミニバッチでランダムにサンプルを選んで学習させ…

2018-04-16

DeepQ-NetworkでOpenAI Gymに挑戦！

AI OpenAI Gym python 人工知能強化学習

DeepQ-Networkとは一言で言うと多層のQネットワークです。 Qネットワークに隠れ層を追加して多層化したもので、今回はExperience Replayというアルゴリズムを使って実装していきます。メモリにステート、アクション、次のステート、次のアクションを記録…

2018-04-15

Q-NetworkでOpenAI Gymに挑戦！

強化学習人工知能 python OpenAI Gym AI

Q-Networkに挑戦してみる強化学習のQ-NetworkでOpenAI Gymのフローズンレイクに挑戦します。目標は前回までのQラーニングよりさらにゲームが上手いAIを作ることです。 Q-Networkについて簡単に説明しておきます。ステートと重みをかけ合わせてQ値を求めま…

2018-04-15

OpenAI Gymで強化学習！

OpenAI Gym 人工知能強化学習 AI python

ベルマン方程式前回の続きです。 OpenAI GymのFrozenLake-v0を攻略して行きます。 Qテーブルを更新するのにベルマン方程式を使うので、まずはベルマン方程式についてお話しします。 Q(s,a) = r + γ(max(Q(s',a'))) Q：行動価値関数 s：state a,：action r…