風の行方とハードボイルドワンダーランド

再雇用の機会を捨て自由な時と空間を・・・ 人は何のために生まれてきたのだろうか? これから本当の旅がはじまる・・・

Entries

人工知能、囲碁でプロを破る

今朝の日経新聞の一面記事。コンピュータが囲碁でプロに勝つ事はありえない、と少々プログラムというものを知っているヘボ碁打ちとしては思っていたので、驚愕して記事を精読。新聞の3ページ目には更に詳細にして正確な記事もあった。こんなビッグニュースはどの新聞にもあると思ったが、シリコンバレー=小川義也とあるから特派員による特ダネかもしれない。
囲碁グーグル

この記事の瞠目すべき点は「自ら学習、性能向上」という点。これまでの将棋ソフトも囲碁ソフトも、多分だが目的関数というものがあって、それが最小となる手を最善として選択していた。どの手が良い手かはアルゴリズムによる。だから、コンピュータと戦うといっても、実はプログラマーと戦っているにすぎない。囲碁のソフトが弱い(プロに比してだが)のは、目的関数の最小値の幅(選択肢の数)が多すぎるのであるレベル以上になると正解はあり得なくなってしまうから。今回のプログラム(AI=人工知能と呼ぶ)は全く別のアプローチ。コンピュータが自分で考える。脱アルゴリズム。これが実用化レベルになったというのがビッグニュ―スの所以。

記事を一部引用;
グーグルが開発した囲碁AI「アルファ碁」は、コンピューターが自ら学習する「ディープラーニング(深層学習)」と呼ばれる手法を採用。先の手をしらみつぶしに計算する従来法とは異なり、盤面上の碁石の配置全体を見ながら人間のようにデータや経験をもとに次の一手を決める。(中略)既存の囲碁ソフトとの対戦では勝率99.8%を達成。昨年10月に欧州チャンピオンのファン・フイ氏と対戦したところ、5戦全勝した。アルファ碁は3月にソウルで、世界的なトップ棋士、李世乭(イ・セドル)九段との5回戦に挑む。

このAIを開発したのはグーグルが2014年に買収した英国のDeepMind社。DeepMind社を率いるのは、アメリカの大学院で脳神経学を研究していたDemis Hassabis氏。天才チェスプレイヤーとも言われる。同社のHPがこちらで今回の日経新聞記事のネタ元だろう。ネイチャーの日本版、英国版HPにもこの話は掲載されている。
Deep Mind

DeepMind社のAIについては株式会社ココマッチー(→http://cocomachi.tokyo/deepmind)に詳しいので以下引用。このAIがどのようなものかよくわかる。多くの人間がやっている判断機能がDQNにとってかわられる日も遠くない。会社から無駄な会議時間と人が消えるかも。人間は忘れるが、機会は学習したことを全て覚えているから。ペッパーで感動した我が身を恥じ入るばかり(覚えていた!、良かった)。

なお、3月の李世乭との5回戦の結果は興味深いが、結果は重要ではない。李世乭と互角に対戦できるというだけで凄いことなのだ。

DeepMindが開発した人工知能として最もポピュラーなのが、学習アルゴリズムのDQN(Deep Q-Network)でしょう。DQNは、脳神経科学と機械学習を応用して開発されています。DQNの実力は、後述するゲームでの実験結果で確認しましょう。ゲーム画面の出力信号と「高いスコアを出す」という指令のみで動くDQNは、他の人工知能を大きく凌ぐのです。

DeepMindのすごさは、たった4時間で人間を超える結果を出していることです。デモを見てみましょう。動画の前半では、DeepMindがブロックくずし(Breakout)ゲームをマスターしていく様子が紹介されています。このゲームは、画面下のバーを左右に動かして画面上(前方)のブロックをくずしていくものです。DeepMindは、ゲームの内容も操作方法も知りません。そのため、はじめは失敗してばかり。しかし、1時間もすると初心者ほどの操作ができるようになっています。さらに1時間が経過すると、人間並の動きができるようになっていますよね。ゲームを開始してから4時間が経過したころには、なんとプロゲーマーを超えるレベルになっています。ブロックに一列の穴を空けて、裏側から一気にブロックをくずしています。ここまでくると、もはや離れ技と言えます。

念を押しますが、DeepMindはゲームの内容も操作方法も知らされていません。自らゲームのルールを把握し、難易度の高い技をやってのけたのです。しかも、ゲームをはじめてたったの4時間で。驚異的ですね。
関連記事
スポンサーサイト

*Comment

Comment_form

管理者のみ表示。 | 非公開コメント投稿可能です。

右サイドメニュー

検索フォーム

最新トラックバック