最強囲碁AI アルファ碁解体新書深層学習、モンテカルロ木探索、強化学習から見たその仕組み

著者大槻 知史
監修三宅 陽一郎
発行所翔泳社
刊行2017/07/19(初版第1刷)
入手福岡天神のジュンク堂書店福岡店で購入
読了2018/02/01

「アルファ碁」の登場は衝撃的で、私も元のNature論文を読んでみようと思ってダウンロードしてみたものの、 とても私には歯が立たないことがすぐにわかった。 最近、その解説書が出たことに気づいて買って読んでみることにした。

本書はかなり丁寧にわかりやすく書かれており、細かいところは別として、「アルファ碁」の概要はよくわかった。 ディープラーニングとか、手数の長いゲームの強化学習とか、モンテカルロ木探索とか、なぜこんなもので うまくいくのか不思議な部分も多々あるのだが、量が質に転化するというのはこういうことを言うのであろう。 まさに数の暴力である。とはいえ、数の暴力さえあればよいかというともちろんそんなことはなくて、 いろいろな技術の組み合わせのバランス調整が腕の見せ所であることもよくわかった。 それとここまで数を出すには並列計算が必要なので、いかに高速に CPU、GPU を使っていくかにも相当の腕が必要である。

「アルファ碁」を一口に言えば、10年くらい前に開発された「モンテカルロ木探索」をベースにしながらも、 ディープラーニングを用いて「直感」を鍛えたコンピュータ囲碁(最近の言葉でいえば「囲碁AI」)のプログラムである。 それによって、従来の「モンテカルロ木探索」に比べて、イロレーティングで 1000 以上強くなったとのことである。 ディープラーニングによって「直感」が鍛えられるというのも、私が「アルファ碁」で初めて知ったことである。 人間の脳細胞の「直感」というやつも結局つまるところこういうものかとも思う。

しかし、「直感」というのはやっかいなもので、コンピュータの直感は結果が出た後でもほぼ説明不能だし、 人間の直感だってほぼ説明不能である。だからこそ、囲碁や将棋の世界では天才少年少女が現れる。 論理能力や言語能力は普通の大人に比べてそれほど高くないと思える子供が、 囲碁や将棋になると普通の大人では全く歯が立たないということがしばしば起こる。 コンピュータがそういう説明不能な能力を発達させるということは一昔前には想像できなかった。驚くべきことである。 ディープラーニングは、やっている操作は説明可能だが、出てきた結果はよくわからない。不思議なものである。

囲碁AIの発展は目覚しく、つい最近 (2018/01/17) も、「アルファ碁」を追いかけている 「絶芸」(中国のゲーム会社テンセントが開発している囲碁AI)が世界最強棋士の柯潔に二子置かせて勝ったそうな。 二子置かせて勝つということは、はっきり力の差がついてしまったということだ。

サマリー

Chapter1 アルファ碁の登場

Chapter2 ディープラーニング~囲碁AIは瞬時にひらめく~

本章は、アルファ碁の「直感」を担うディープラーニングの解説。

Chapter3 強化学習~囲碁AIは経験に学ぶ~

本章は、アルファ碁を対局によって「経験」的に学ばせる強化学習の解説。

第4章 探索~囲碁AIはいかにして先読みするか~

本章は「アルファ碁」の「読み」を支えるモンテカルロ木探索の解説。

第5章 アルファ碁の完成~囲碁AIはいかにして先読みするか~

本章では、「アルファ碁」においてこれまで説明してきた技術がどう組み合わされているかを解説する。