強化学習とは・AI関連用語集

強化学習とは、意味や概念を詳しく解説

menu

×AI

AI用語事典

強化学習

reinforce

強化学習とは、教師あり学習や教師なし学習と同じく、コンピューターに機械学習を行わせるための方法のひとつ。行動の選択を取り扱うような問題を解決するためのもので、具体的なデータを基にした学習ではなく、現在の状態をプログラムそのものが観測し、連続した一連の行動をとった結果どうすれば最も大きな価値(報酬)を得られるか?をコンピューターが学習してゆくという非常に画期的な技術である。

この強化学習の代表例は2016年、Googleが開発したAI「AlphaGo」が、韓国のプロ棋士を囲碁で打ち負かしたというニュースが挙げられるだろう。この仕組みとしては、まず膨大な打ち手の情報データをコンピューターに「教師あり学習」させた上で、最適な手を取った時に「報酬」を与えるとして「強化学習」を行う。すると「報酬」を得るための行動をコンピューターが自動的に最適化するようになり、必勝法をパターンとして蓄積していくのである。

その後コンピューター同士の対局を膨大な数繰り返せば、更にレベルの高い最適化を行えるようになり、結果様々なゲームで達人めいたスコアを叩き出せるというわけだ。このAIが登場するまで、囲碁や将棋は手の数があまりに多すぎてコンピューターが人間を超えられることはないと考えられていたのだから、いかに歴史に影響を及ぼしたかが分かる。

強化学習が今後活かされる場として、最も期待されているのは「自動車の自動運転技術」である。これはロボットの制御と同じシステムが使用できると言われており、アクセルやブレーキ、カーブなど自動車の行動に「報酬」を与える強化学習を行うことで、様々な状況に対応できるようになっていくのではないかと言われている。

既にアウディをはじめとした多くのメーカーで実現され始めているハンズフリー運転だが、本格的に人の手が必要なくなる未来が来るかもしれないと考えると非常に感慨深いものだ。

AI用語解説:×AI編集部監修

AI用語を調べる

アイウエオ索引

アルファベット索引

AI用語事典TOPに戻る