なぜAlphaGoは人類最強棋士に勝つことができたのか？その理由2つ

AlphaGoはDeepMind社によって開発された、人間の一流棋士をハンディキャップなしで初めて破ることができたコンピュータ囲碁プログラムです。

2016年3月に行われたAlphaGoと李世乭（イ・セドル）九段との対局で、AlphaGoが勝利したニュースは非常に大きな話題になりました。当時、一流棋士に勝つためにはまだまだ長い時間がかかると思われていたにも関わらず、なぜAlphaGoは一流棋士に勝利することができたのか、気になりますよね。

ということで、今回はAlphaGoの強さの理由2つと、AlphaGoがイ・セドル九段をはじめ、当時の人類最強棋士たちに勝利できるまでの経緯について見てみましょう。

（参考）DeepMind社
DeepMind（ディープマインド）はイギリスの人工知能企業であり、2010年にDeepMind Technologiesとして起業しました。2014年にGoogleによって買収されています。

AlphaGo以前のコンピュータ囲碁プログラムについて
AlphaGoの誕生、樊麾（ファン・フイ）二段との対局
1. 強さの理由（その1）
2. 強さの理由（その2）
次の対局相手、李世乭（イ・セドル）九段とは
李世乭（イ・セドル）九段との対局
ネット上の謎のコンピュータ囲碁プログラム「Master」の登場
柯潔（カケツ）九段との対局

AlphaGo以前のコンピュータ囲碁プログラムについて

コンピュータ囲碁プログラムが最初に作成されたのは1968年ですが、その後35年経過してもコンピュータ囲碁プログラムは人間のアマチュア初段にも及ばないという状況が続きました。

2006年、「モンテカルロ木探索法」という手法採用により、やっとアマチュア6段のレベルになることができましたが、その後一向に強くなれないことから、開発者たちの間では更に強くなるためには何らかのブレイクスルーが必要で、一流棋士に勝つためにはまだまだ長い時間がかかると考えられていました。

（参考）モンテカルロ木探索法
現在の局面において打つことができる「手」の「良さ」を調べるための手法です。

まず囲碁ソフトが一流棋士に対抗できない理由としては、ゲームとしての複雑さに加えて、局面の良し悪し（勝率）の判断精度を上げることが極めて困難、という問題がありました。この局面の判断について、一流棋士は直感で盤面パターンの照合を行っていることから、ディープラーニングにより実現できそうなことは分かっていましたが、計算時間がかかり過ぎることから多くの研究者は当時、適用困難と考えていました。

（参考）ディープラーニング（みんなの人工知能用語集）

しかし2015年、Google傘下のDeepMind社が囲碁AIを開発しているという情報が流れ、研究者の間ではその資金力と技術力から期待感が高まっていました。

そして同年、いよいよAlphaGoが私たちの前に姿を現します。

AlphaGoの誕生、樊麾（ファン・フイ）二段との対局

2015年10月、AlphaGoは当時ヨーロッパ王者であったファン・フイ二段と対戦、5勝0敗で勝利します。これが、コンピュータ囲碁プログラムによる人間の一流棋士に対する初勝利となります。ファン・フイは対戦後のインタビューで「囲碁を進めるほどにAlphaGoはミスを犯さない完全体のようだという感じを受け、それが大きな圧迫になった」と述べています。

ここで、 AlphaGoの強さの理由2つについて見てみましょう。

強さの理由（その1）

以下の3つの能力の高さがあります。特に「勝率の予測能力」は今まで不可能と言われていた技術で、 AlphaGoにより初めて実現することができました。

次の一手の予測能力

ある局面において、次の一手をどこに打つべきか、ディープラーニングにより判断します。具体的には、碁盤の目それぞれの位置にオススメ度を計算します。

最も有望な手を探索する能力

ある局面における有望な手のうち、どれが最も有望な手なのか、モンテカルロ木探索法により判断します。

勝率の予測能力

ある局面の良し悪し（勝率）を判断します。一流棋士はある局面の良し悪し（勝率）を盤面パターンより直感で判断しますが、この判断をディープラーニングにより実現しています。

強さの理由（その2）

AlphaGoは上記3つの要素技術を組み合わせることにより、今までのコンピュータ囲碁プログラムから大きく突き抜けた強さを実現しています。DeepMind社によると、上記の各要素技術を単独使用した場合のAlphaGoのレーティング（強さを示す指標）は1700程度に留まりますが、3つの要素技術を組み合わせることにより3000程度に達するとしています。（対局当時のファン・フイのレーティング2908に対しAlphaGoのレーティングは3144）

（参考）レーティング
棋士の強さを示す指標です。なお、AlphaGoのレーティングはDeepMind社による参考値です。

次の対局相手、李世乭（イ・セドル）九段とは

先程のファン・フイとの対局に勝利したGoogleは2016年1月、AlphaGoの次の対戦相手が李世乭（イ・セドル）九段であることを発表します。

このイ・セドルは対戦当時（2016年）は世界ランク5位でしたが、2007年から2011年まで世界ランク1位、囲碁世界タイトル優勝回数が歴代2位という、2000年代半ばから2010年代前半にかけて世界最強と言われていた棋士です。当時はその圧倒的な強さから「囲碁界の魔王」とも呼ばれていました。まだまだ長い時間がかかると言われていたコンピュータ囲碁プログラムが、こんなにも早く世界最高峰のプロ棋士と対戦することになったわけです。

なお、当時のイ・セドルはAlphaGoとファン・フイが対局した棋譜を分析した結果、AlphaGoはまだ自分の敵ではないと判断していました。（当時のAlphaGoのレーティング3144に対し、ファン・フイは2908、イ・セドルは3555）

対戦前、イ・セドルは5勝0敗あるいは4勝1敗で自らの勝利を予想、また2017年にAlphaGoと対戦することになる、当時世界ランキング1位の柯潔（カケツ）九段は記者からの質問に対し「イ・セドルが勝つ方に100％掛けたい」と述べています。当時の囲碁関係者のほとんど全員が「AlphaGoがどんなに強くても、こんな強い人には勝てるわけがない」とイ・セドルの全勝を予想していました。

しかしながら、対局までの間にAlphaGoは自己対戦による強化を繰り返すことにより、5ヶ月間でレーティングをイ・セドルの3555に対し3739まで改善のうえ対局に臨みます。

李世乭（イ・セドル）九段との対局

2016年3月に行われたAlphaGoとイ・セドルとの対戦は、AlphaGoが4勝1敗と勝利します。この全くの予想外の敗北に対する囲碁界の衝撃は相当大きいものであったようです。なお、イ・セドルとの対戦において有名なエピソードありますので2点紹介します。

エピソード①／第2局、AlphaGoの37手目

このAlphaGoの37手目が全くの想定外であったため、放送中継オペレータは思わず別の位置に打ってしまいます。また、解説者（囲碁棋士9段）も良手か悪手か分からないと正直にコメント。イ・セドルは碁盤をしばらく見つめてから席を立ち15分間その場を離れてしまいます。その後席に戻りますが、対局開始から4時間20分後、イ・セドルは負けを認めることになります。

エピソード②／第4局、イ・セドルの78手目

先程のエピソードとは逆に、イ・セドルの78手目はAlphaGoの想定外であったようで、その後AlphaGoは大きく崩れ始め、悪手を打ち続けてしまい、イ・セドルの勝利となります。想定外の手を受けてAlphaGoも人間にように混乱してしまうのか、と話題になりました。このイ・セドルの78手目は「神の一手」とも言われましたが、イ・セドルは「その手を打った理由は、そこしか打つところがなかったからだ。そのような称賛を受けると、かえって戸惑う」と述べています。

なお第1局の後、当時のイ・セドルに9勝していた世界ランキング1位の柯潔（カケツ）九段（その後2017年にAlphaGoと対局）は「AlphaGoはイ・セドルに勝っても、私には勝てない」と豪語しますが、対局が進むにつれて「もしも条件が同じ場合、私が負けることもありそうです」と訂正しています。

ネット上の謎のコンピュータ囲碁プログラム「Master」の登場

イ・セドルとの対局から半年後、ネット上には多数のコンピュータ囲碁プログラムが登場しました。その中で、非公式戦ではあるものの、トッププロと数多くの対局を行う謎のコンピュータ囲碁プログラム「Master」が、唯一の無敗を誇っていました。

このMasterは一週間でトッププロ60名と対戦、実に60勝0敗！という無敗の成績を残すことになります。この60名の中には当時世界ランキング1位の柯潔（カケツ）九段も含まれていました。その後、Masterの正体が実はAlphaGoであり、この60戦はプロトタイプバージョンのテストであったこと、また17年にAlphaGoによる公式戦を予定していることなどがDeepMind社より公表されました。

そして2017年4月、DeepMind社は5月に当時世界ランキング1位の柯潔（カケツ）九段とAlphaGoで対戦を行うと発表しました。この時のAlphaGo（60勝したMaster）のレーティングはカケツの3648に対して、実に4858！にも達していました。

柯潔（カケツ）九段との対局

2017年5月に行われたAlphaGoとカケツとの対戦はAlphaGoの3勝0敗と、AlphaGoの圧勝に終わりました。19歳で囲碁界の頂点に登り詰め、その奔放さから「柯潔大帝」とも呼ばれ、当時の誰もが人類最強と認めるカケツですらAlphaGoには全く歯が立ちませんでした。

3局目では対局から2時間経過したところでカケツは席を立ちます。約15分後に席に戻り、涙を拭い対局を続けますが、対局開始から約3時間後にカケツは負けを認めることになります。

1局目の後にカケツはAlphaGoについて「人間では想像もつかない手を打ち、強かった」、また3局目後の記者会見では「最終戦前日の夜は眠れなかった」とも述べています。なお、対局から2日後のLG杯世界棋王戦において、カケツが「人類との対局はこんなにも気楽」とSNSに呟いたことも話題になりました。

そしてDeepMind社は本対局を人間との最後の対局とし、AlphaGoの引退を発表しました。ただし、DeepMind社はその後もAlphaGoの改良を続け、2017年10月に学術誌NatureにおいてAlphaGo Zeroを発表しました。

従来のAlphaGoがプロ棋士による対戦棋譜を学習データとして活用していたのに対し、AlphaGo Zeroは人間による対戦棋譜を使用せずに囲碁のルールのみ教わったうえで、2900万局の自己対局を繰り返すことにより強化学習を行いました。（AlphaGo Zeroのレーティングは5185）

以上、今回はAlphaGoの強さの理由2つと、AlphaGoが当時の人類最強棋士に勝利できるまでの経緯について見てきました。

強さの理由（その1）

以下の3つの能力の高さ
１）次の一手の予測能力
２）最も有望な手を探索する能力
３）勝率の予測能力（AlphaGoにより初めて実現）

強さの理由（その2）

AlphaGoは上記3つの要素技術を組み合わせることにより、今までのコンピュータ囲碁プログラムから大きく突き抜けた強さを実現

AlphaGoが当時の人類最強棋士に勝利できるまでの経緯

●2015年10月、当時ヨーロッパ王者であった樊麾（ファン・フイ）二段に5勝0敗で勝利
●2016年3月、李世乭（イ・セドル）九段に4勝1敗で勝利
●2016年12月～2017年1月、ネット対戦によりトッププロに60勝0敗で勝利
●2017年5月、柯潔（カケツ）九段に3勝0敗で勝利

一流棋士に勝つには長い時間がかかると言われていたにも関わらず、AlphaGoは私たちの予想を大きく超えて、あっという間にはるかな高みへと到達してしまいました。DeepMind社はこの経験を生かし、今後、難病の早期発見や電力需給調整などへのAI（人工知能）の活用に取り組むとしています。

ちなみにDeepMind社CEOのデミス・ハサビスはイ・セドルとの対局後に、「AlphaGoが毎秒あたり数万におよぶ手を読んでいるのに対し、セドルさんは彼自身の頭脳だけで、あれだけの接戦を演じ（以下略）」と述べています。

確かに、AlphaGoは特別仕様ハードウェア（ディープラーニング処理を高速化するためのGoogle社独自開発のハードウェア）の能力に依存している「力まかせ」感はあります。毎秒あたりの処理数で圧倒的に不利な中、（敗れたとはいえ）善戦できた私たち人間の脳には、まだ解明されていないすばらしい能力があるのかもしれません。

今後のAI（人工知能）の進歩により、私たちの脳についての解明が更に進むことを期待したいですね。

参照元

大槻知史著「最強囲碁AI アルファ碁解体新書」増補改訂版（翔泳社）

モンテカルロ木探索

AlphaGo(wikipedia)

アルファ碁「イ・セドル九段に勝つために5000年分勉強した」

盤上で探す「神の一手」、人間と人工知能が紡ぐ思考

人類とAIの決戦を現地で見届けた棋士が、その先にみるもの