AI(人工知能)用語集

機械学習(強化学習)をイメージでサクッと理解

強化学習

囲碁AIがトッププロ棋士に勝利したことや、Googleが自動運転に関する特許競争力でトヨタ自動車を追い抜いたなど、日々AI(人工知能)に関するニュースが飛び交っていますよね。今ご紹介したニュースの背景には、AI(人工知能)ブームの火付け役となったディープラーニング(Deep Learning)もさることながら、「強化学習」という技術も深く関わっています。

つっちー
つっちー

ディープラーニング(Deep Learning)とは、AI(人工知能)を支える中心的な技術のうち、脳の仕組みを単純化して、コンピュータのプログラム上で再現したものの一つです。ディープラーニング(Deep Learning)については以下のページで詳しく解説しています。

AI(人工知能)に興味のある方なら、「強化学習」という言葉を耳にしたことがある人もいるかもしれません。今回は、こうした囲碁AIや自動運転技術の背景にある「強化学習」についてお伝えしてきます。

もちろん、「強化学習なんて言葉今初めて聞いたよ・・・なんじゃそりゃ」という方もすんなり理解できるように解説していきますので、ご安心ください。

一言で言うと「強化学習」とは・・・

赤ちゃんが歩くために何度も試行錯誤をするのと同じで、たくさんの経験から上手くいく行動を学んでいく方法です
つっちー
つっちー

ちなみに、私は甥っ子が自分の足だけで立つ瞬間に以前立ち合ったのですが、生命の力強さというか感動で胸がいっぱいになりました!素晴らしい思い出として残っています(^^)

感動しているつっちー

今回お話するのはここ!!

機械学習と強化学習の関係

「強化学習」は機械学習でできることのうちの一つです!それでは「強化学習」について詳しく見ていきましょう。

つっちー
つっちー

機械学習とは、(AI(人工知能)の中心をなす技術で、プログラム自身が学習していく仕組みです。「機械学習」については以下のページで詳しく解説しています。

強化学習は赤ちゃんが経験を積んで歩けるようになっていくイメージ

「強化学習」を理解するには、赤ちゃんの例がわかりやすいです。赤ちゃんは、はじめは上手く歩けませんよね。みなさんご存知の通り、何度も何度も自分で歩こうと試行錯誤します。失敗を繰り返しながら、上手くいく歩き方を習得していき、自然と歩けるようになっていきます。

そして今回のテーマである「強化学習」とは、この例のように経験から試行錯誤をして、ある目的を達成するにはこの場合どうすれば良いかといったような最適な行動を、コンピュータが学んでいく手法のことを言います。

強化学習を支える3つの概念、「環境」「行動」「報酬」

強化学習を理解するには、「環境」「行動」「報酬」という3つの概念が重要です。

※ひとまず、以下の3つの概念があるんだな〜ぐらいの軽い認識でOKです。

  • 環境・・・ある時点の状態
  • 行動・・・その状態での実際の行動
  • 報酬・・・その行動によって上がったスコアや目標に対する貢献

 

今回「強化学習」を赤ちゃんの例に置き換えて説明しましたが、「強化学習」では赤ちゃんのこと(学習を行う主体)をエージェントと言います。

赤ちゃん(エージェント)は、まだ歩くことができないという状態(環境)で歩こうと挑戦し(行動)、その挑戦(行動)によってどれだけ歩けたか(報酬)が、より大きくなるように努力を続けていくというわけです。

赤ちゃんが立ち上がりそうなイメージ

つまり、「強化学習」におけるエージェントは、「環境」において何かしらの「行動」を起こし、その行動から得られる「報酬」を獲得するという処理を何度も反復することで、報酬の合計が一番大きくなるように学習していきます。

「強化学習」は、最近では自動運転やゲームAIなどの分野で非常に注目を集めている技術であり、今後もさらなる活用が期待できるでしょう!

まとめ

つまり、「強化学習」とは、

経験を通じて試行錯誤をし、ある目的を達成するためにこの場合どうすれば上手くいくか、といった最適な行動をコンピュータが学んでいく手法です。
つっちー
つっちー

AI(人工知能)って「なにそれ美味しいの?」ってレベルだった僕が、AIエンジニアを目指してステップを踏んだり踏まれたりしている記事を書いてます。よかったら読んでみてください(ほぼ実話)。

「歩く負債」と言われた僕がゼロからAIエンジニアになる為のステップを実践してみた!
みんなのAI(人工知能)用語集

コメントをどうぞ

トップへ戻る
タイトルとURLをコピーしました