ニコニコ大百科モバイル

7/2(月)よりスマホまたはPCでアクセスした場合、各デバイス向けのサイトへ自動で転送致します


AlphaGo


ヨミ: アルファゴ
掲示板をミル!
82カキコ!

AlphaGo(アルファ碁・アルファ)とは、囲碁AIである。Google下のDeepMind社が開発した。
互先(ハンディキャップなし)でプロ棋士に初めて勝利した囲碁プログラムである。

概要

深層学習ディープラーニング)や強化学習の研究の成果として生み出された囲碁AIである。
あくまでも研究成果の一つであり、将来的には囲碁だけではなく、自動運転、融予測、医療分野(類似症例のカルテ検索)、画像検索など、多的な分野で技術が応用される事をしている。


コンピュータ囲碁の歴史


1969年~2004年

コンピュータ囲碁1969年に最初のプログラムアメリカで書かれたが、これはコンピュータ将棋(本将棋)の開発が1974年に始まったのにべても5年い(コンピュータチェスの開発は1950年代に始まっている)。もともと囲碁は欧でも数学者や物理学者、コンピュータ科学者の間ではある程度知られており、アルベルト・アインシュタインジョン・ナッシュアラン・チューリングらが囲碁をたしなんでいたことが知られている。チューリング第2次世界大戦イギリス軍に協ドイツ軍エニグマ暗号の解読作業に当たっている中、席を並べていた数学者のI.J.グッドに囲碁を教えていた。このグッドが1965年に「囲碁という」と題した記事を雑誌に寄稿したのが、ヨーロッパにおいて囲碁が普及するきっかけになったとされる。

ところが開発が始まってから35年が経過しても、コンピュータ囲碁は依然として人間の「アマチュア初段」の棋にも及ばなかったIBMのディープブルーガルリ・カスパロフを破ってから10年が近づこうとし、同じように難攻不落であり続けた将棋が、それでもアマチュア高段者程度、プロ棋士相手に落ちで勝負になる程度の棋をつけ、招待されたアマチュアの全大会で上位進出を果たし「格段の成長を遂げた」とされていた頃においてである。

2005年から2012年まで ~モンテカルロ木探索~

この状況をブレイクスルーしたのが、フランス人のレミ・クーロン2005年リリースした囲碁プログラムCrazy Stone」である。ランダムな打ち手による終局までの棋譜を大量に生成してその中で最も勝率の良い手を採用する「モンテカルロ法」と、それ以前からボードゲームで採用されていた「ゲーム木探索」の方法を組み合わせた「モンテカルロ木探索法(MCTS」を採用したCrazy Stoneは翌2006年くもコンピュータ囲碁世界一になると、分厚いだったアマチュア初段レベルをあっさりと突破し、プロ棋士を相手にして2007年には8子局、2008年には7子局で勝利できるようになった。

一時期クーロンCrazy Stoneの開発をストップするが、MCTS爆発的な普及によりその他のプログラムも大幅に棋を向上させ、その中から日本の尾陽児と加藤秀樹によるZenが台頭する。Zenは2011年に6子局で、2012年には4子局でプロ棋士勝利した。この頃からクーロンも再度Crazy Stoneの開発に注し始めコンピュータ囲碁界はCrazy StoneとZenの二強の争いを中心とした構図になる。また、2015年には韓国人のイム・ジェボムが開発したDolbaramが二強に並ぶをつけるに至った。こうした競争の中で、コンピュータ囲碁が成長し、プロ棋士に勝てるようなをつけるに至るのではないか、とも思われたのである。

2012年から2015年まで ~停滞期~

ところが、2012年に4子局でプロに勝って以降、3年を経過しても一向にコンピュータ囲碁は強くならなかった。じりじりと棋は伸びてはいるのだが、3子でプロを相手にすると全くが足りないのである。この時点でのコンピュータ囲碁の棋アマチュア6段程度と見込まれており、開発者たちもMCTS法の限界をこの辺りに感じ、さらに強くなるにはもう一段のブレイクスルーが必要で、それにはあと10年程度はかかるのではないか、というのが共通見解になっていた。

2016年

2015年、開発者コミュニティの中でGoogle下のDeepmind社が囲碁AIを開発しているという情報が流れ、その資と技術から期待感が高まっていた。「アマチュア6段のを破り、3子で勝てるレベルになるのではないか」と。
そして、10月頃には関係者が「あと数ヶで驚きの発表をできる」とメーリングリストでほのめかす。

しかし、2016年1月に飛び込んできたニュースはそんなレベルはるか駕し、コンピュータ囲碁関係者に驚動地の驚きを与えるものだった。
欧州チャンピオンで、中国プロ資格を持つ樊麾(ファン・フイ)二段が、囲碁ソフトハンデゼロ互先で5戦全敗したというのである。また、販版のCrazyStoneやZen相手に495戦494勝という圧倒的な差をつけて勝利するに至ったというのである。このAIこそ、深層学習に強化学習を組み込んだAlphaGoであった。

Fan Hui vs. AlphaGo持ち時間は各1時間、読み30、3回の考慮時間あり。
対局日 結果
第1局 2015年10月5日 Fan Hui AlphaGo 半勝ち
第2局 2015年10月6日 AlphaGo Fan Hui 中押し勝ち
第3局 2015年10月7日 Fan Hui AlphaGo 中押し勝ち
第4局 2015年10月8日 AlphaGo Fan Hui 中押し勝ち
第5局 2015年10月9日 Fan Hui AlphaGo 中押し勝ち
AlphaGo 5勝 - 0勝 Fan Hui

この学習の成果は科学誌Natureに論文が掲載されたが、そんなもん読むわけない囲碁ファン
「そもそも欧州プロって強いの?」
アマではないだろうけど2~3年前にできたばかりでしょ?」
世界トップアマクラスではあるだろうが、日本の現役棋士・一流棋士べてどうなんだ?」
と疑問が積もるばかりであった。

棋譜も開されはしたが、樊麾二段のミスばかりが摘される始末。
とはいえ「確かに今までのAIべて自然で、段違いな強さは感じる」という評価は共通だった。

そんな中、Googleからとんでもない発表がされた。

AlphaGoを世界最強棋士と対局させます!
100万ドルです!

良くてあと10年はかかるとされていた囲碁AIは、たった半年で世界最高峰のプロと戦う事となる。

Google DeepMind Challenge Match
Lee Sedol vs AlphaGo

google過去10年の世界戦のデータを参考に、最も強い棋士としてイ・セドル九段を名し、本人も了承。囲碁AIの挑戦は韓国で行われる事になった。(なお、日本井山裕太九段・中国の柯潔九段も補者であったという噂もある)

ルールはコミ7半の中国ルール。持ち時間は各2時間で読みは1分、3回の考慮時間がある。
前述したが、セドルが勝ち越すと賞100万ドル。一勝につきボーナスも出る。
AlphaGoが勝ち越した場合は慈善団体・囲碁団体などに寄付される。
また、どちらか一方が勝ち越したとしても5局全て消化される。
AlphaGoの代打ちは、開発者であり台湾アマ六段でもあるAja Huangが務める。

この頃、東洋囲碁にdeepmindという高段IDが出現しており、正体はAlphaGoなのではないかと注されていた。DeepMind社CEOのデミス・ハサビく「そのアカウントは開発者のうちの一人の個人的なアカウントで、開発者個人の対局である」とのことで、相はのままである。
チャレンジの最中は「コウの禁止が契約に入っていた」などというデマが流れたが、ハサビス氏がツイッターで明確に否定した。

対局の模様はYouTubeで生中継された。
解説は5局通じてマイケルレドモンド九段(日本棋院)。
中国囲棋TVでもトップ棋士を解説として招いて中継。
日本では玄の間で解説付きの棋譜中継、ニコ生では大盤を使わずに中継した。

Lee Sedol vs. AlphaGo
対局日 結果
第1局 2016年3月9日 セドル AlphaGo 中押し勝ち
第2局 2016年3月10日 AlphaGo セドル 中押し勝ち
第3局 2016年3月12日 セドル AlphaGo 中押し勝ち
第4局 2016年3月13日 AlphaGo セドル 中押し勝ち
第5局 2016年3月15日 セドル AlphaGo 中押し勝ち
AlphaGo 4勝 - 1勝 セドル

当初セドルの5タテを疑わなかった囲碁民だったが、第一局を落とすと向きが一気に変わってしまう。

第二局は理にかなったAlphaGoの新布石やセドルの勝負手を的確に処理する中盤戦、高いヨセなどなど、「これ勝てないんじゃね?」という潮が強まっていく。

第三局、セドルが「自分らしく打つ」とり用いたのは高中国流。
だが序盤の戦いからAlphaGoが優勢を築くと、そのまま逆転できないまま終了。
「日を追うごとに強くなってる説」が出始める。もちろん、すべての対局で同じバージョン(v18)が使われており、そのようなことはいのだが、AlphaGoの圧倒的な強さを前に飛躍した推測が後を絶たなかった。

第四局、セドルらしくないが、序中盤をじっと慢し、中央で強な勝負手が成功。
中国の生中継では「神の一手」「読みではなく心で打った手」と最高の評価。
その後、AlphaGoが酷い手を連発しセドルが勝利

そのまま連勝が期待されたが、残念ながら第五局は落とした。
セドル九段はこの挑戦の最中7キロ痩せてしまった。

囲碁熱の高い中韓では連日このニュースで盛り上がり、日本でもAI進化の様子がトップニュースとして取り上げられた。
試合後、韓国棋院はAlphaGoに名誉九段の免状を授与した。プロとしての名誉九段が与えられたのは、これが初めてである。

プロ棋士 vs Master

Now, I am the master.

@ScienceNews[外部]

セドル九段とAlphaGoの闘から半年後、ネット上の囲碁対局サイトには多数のAIが出現していた。
2016年末、世はまさに囲碁AI戦国時代であった。

God Moves
ネットサイトの1つであるKGSには「Zen19L」という囲碁AIが参加していた。これは第2回囲碁電王戦趙治勲名誉名人と互の戦いを繰り広げた「DeepZenGo」と同バージョンのZenである。11月29日KGS彗星のごとく現れた「God Moves」というアカウントはこのZen19Lに3連勝。均5前後という短い着手時間から、God Movesの正体はコンピュータであると噂された。驚くべきはその布石である。1局こそ普通の布石だったが、2局は初手天元、3局にいたってはなんと天元一間ジマリであった。いわゆる舐めプレイとも捉えられる布石でZenに圧勝したのである。Zenに三連勝したのち、God Movesはこつ然と姿を消した。現在God Movesの正体は判明していない。
絶芸・刑
囲碁には「絶芸」「刑」というアカウントが登場した。これらは中国Tencent社が開発した囲碁AIである。特に刑トッププロ達を相手に八割以上の勝率を誇り、世界二冠王である柯潔九段と互の勝負を繰り広げるなど、1年前のAlphaGoを彷彿とさせる強さであった。

たった3局で姿を消してしまったGod Moves。強いとはいえ死活などに弱点があり、負けることもある刑。一方で、何十局もの対局を行い、いまだ敗のアカウントが存在した。その名は「Master」である。


次へ»
最終更新日: 19/09/15 14:59
タグ検索 パソコン版を見る


[0]TOP
ニコニコ動画モバイル
運営元:ドワンゴ