人工 知能 は 人間 を 超える か Chapter02(2)
ただ 、迷路 や パズル の 探索 と 違う の は 、相手 が いる こと である 。
こちら が 指した 手 に 対して 、相手 が 手 を 返して 、さらに こちら が 手 を 指して ……と いう こと を 繰り返して 、探索 木 を つくらない と いけない 。
また 、組み合わせ の 数 が とても 多く 、すぐに 天文学的 な 数字 に なってしまう ので 、なかなか 最後 まで 探索 し きれない 。
どれ くらい の 組み合わせ が ある か と いう と 、8×8 の 盤面 で 駒 が 白黒 、裏返し あり の オセロ は およそ 10 の 60 乗 通り (つまり 、60 桁 の 数字 。
一 、 十 、 百 …… と 数えて いって 、 那由 他 と いう 単位 に 当たる )、8×8 の 盤面 で 駒 が 白黒 6 種類 ずつ の チェス は およそ 10 の 120 乗 通り ( もはや 大き すぎて 単位 が ない )、9×9 の 盤面 で 駒 が 8 種類 ずつ 、「 成り 」 やとった 駒 を 使える 将棋 は およそ 10 の 220 乗 通り 、19×19 の 盤面 で 駒 が 白黒 の 囲碁 は およそ 10 の 360 乗 通り である 。
つまり 、場合 の 数 から いう と 、オセロ が 一番 簡単で 、その 次に チェス 、将棋 、囲碁 の 順番 に 難しく なる 。
観測 可能な 宇宙 全体 の 水素 原子 の 数 が およそ 10 の 80 乗 個 と いわれて おり 、この 数字 が この 世界 で 「数えられる もの 」の 数 として は 最大 だろう から 、盤面 で 起こり うる 組み合わせ が いかに 膨大な 数字 か 、おわかり いただける ので は ない だろうか 。 これ だけ 組み合わせ の 数 が 膨大だ と 、最後 まで しらみつぶし に 調べる こと は とうてい できない 。
そこ で 、盤面 を 評価 する スコア を つくり 、その スコア が よく なる ように 、次の 指し手 を 探索 する こと に なる 。
それ が 現在 まで 続く ゲーム 攻略 の ため の 人工 知能 の 基本的な 設計 と なっている 。
たとえば 将棋 の 場合 、たとえば 、自分 の 「王将 」が 王手 されて いれば マイナス 10 点 、相手 の 「玉将 」に 王手 を かけて いれば プラス 10 点 、王手 は されて いなくて も 自分 の 「王将 」の 周囲 8 マス に 相手 の 「飛車 」「角 」が いたら マイナス 5点、その逆がプラス5点、相手の「歩」が自陣に入り込んできて「と金」に成ったらマイナス1点、その逆がプラス1点……のように決めておく。 その 局面 、局面 で スコア を 計算 し 、仮に いま が 3 点 なら 、次の 手 で は できるだけ 3 点 より 大きく なる ように 指せば よい こと に なる 。
ゲーム は 、自分 は 自分の 点数 を 最大化 (Max)する手を指し、相手はこちらの点数を最小化(Min)する手を指すことで成り立つと仮定すると、5手先、10手先の最善手が決まる。
これ が ミニマックス 法 で 、2 手先 の 盤面 評価 から 次 の 自分 の 指し手 を 決める 方法 を 次 ページ の 図 8 で 紹介している 。
ついに 人類 が コンピュータ に 敗れた と いう こと で 、世界中 に 衝撃 が 広がった 。
持ち 駒 が 使える 将棋 で コンピュータ が 人間 に 勝つ の は 当分 先 と 思われて いた が 、2012年、第1回将棋電王戦で、当時の日本将棋連盟会長・米長邦雄永世棋聖が前年の世界コンピュータ将棋選手権の優勝ソフト「ボンクラーズ」と対戦して敗れた。 その 著書 『われ 敗れたり 』に は 、コンピュータ に 敗れる まで の 経緯 と 心境 が 綴られている (*注 17 )。 翌 2013 年 に は 、現役 プロ 棋士 vs コンピュータソフト による 5 対 5 の 「第 2 回 将棋 電王戦 」が 行われ 、第 2 局 で コンピュータソフト 「ponanza 」が 佐藤 慎一 四段 に 勝利 、史上 初めて 現役 プロ 棋士 が 敗れて 話題 と なった 。
対戦 成績 は ソフト 側 の 3 勝 1 敗 1 分け 、翌 2014 年 の 「第 3 回 将棋 電王戦 」も ソフト 側 の 4 勝 1 敗 で 、コンピュータ 有利 の 状況 が 続く 。
将棋 電 王 戦 は ニコニコ 生 放送 で 中継 さ れ 、「人間 vs コンピュータソフト 」と いう わかり やすさ も 手伝って 、屈指 の 人気 コンテンツ と なった 。
なぜ 強く なって きた か と いう と 、ひとつ は 、コンピュータ の 処理 能力 が 飛躍的に 向上した こと 。
たとえば 、第 2 回 電王戦 に 登場 した 「GPS将棋」は東京大学にある670台のコンピュータと接続し、1秒間に3億手読むといわれていた。 将棋 の 場合 、序盤 の 組み合わせ は それ こそ 無数に ある ため 、どれだけ 処理能力 の 高い コンピュータ でも 、すべて の 手 を 読む こと は できない 。
ところが 、中盤 に なり 、駒 の 位置 が 定まって くる に つれて 、有効 打 の 数 は 限られて くる 。 だから 、コンピュータ は 後 に なれば なるほど 本領 を 発揮 する 。
特に 詰め に 至る 最終 局面 で は まず ミス し ない ので 、中盤 を いかに 戦う か が 、将棋 ソフト との 対戦 で は 重要に なる のだ 。
ほか に も いくつか 強く なった 秘訣 は ある のだが 、ここ で は 2 つ だけ ご 紹介 しよう 。 機械 学習 に よって 、盤面 と 指す べき 手 を 過去 の 膨大な 棋譜 から 学習する こと が できる ように なった 。
そして 、そこ に 新しい 特徴 量 を 使えば いい こと が わかってきた のだ 。
特徴 量 と いう の は 「データ の 中 の どこ に 注目 する か 」と いう こと であって 、それ に よって 、プログラム の 挙動 が 変化 する 。
たとえば 、「王手 を されて いる か 」という の は 1つ の 特徴量 だし 、「王将 が どの くらい 前 に 出て いる か 」という の も 1つ の 特徴量 である 。 以前 は 、機械 学習 で 使う 特徴量 は 、あくまで 「2 つ の 駒 の 関係 」が 中心 だった 。
王将 に 対して 飛車 が この 位置 に ある と か 、金 が 王手 を かけている と か 、2 つ の 駒 の 位置関係 に 注目 して 、指す べき 手 を 計算 していた 。
ところが 、研究 が 進む に つれて 、徐々に 「3つ の 駒 の 関係 」を 使った ほうが 有効だ と いう こと が わかってきた 。
たとえば 、王将 と 金 と 銀 の 位置 関係 が どう なれば 有利な の か 、人間 に は 見えて いなかった 相関関係 を 、過去 の 棋譜 と いう ビッグデータ の 中 から 見つけ出し 、それに よって 次の 指し手 を 絞る ときの 精度 が 向上した のだ 。
それ まで は 、それぞれ の 駒 の 数 や 位置 関係 に 点数 を つけて 盤面 を 評価して いた のだが 、その 点数 の つけ方 が 妙味 であって 、極端な 話 、ある 局面 を どういうふうに 評価する か に よって 、ソフト の 強さ が 決まっていた 。
点数 の つけ 方 は 、あくまでも 人間 が 決めて いた の だ 。
ところが 、モンテカルロ 法 で は 180 度 発想 を 変えて 、ある 局面 まで きたら 、駒 の 数 や 位置 関係 に よって 点数 を つける こと を 放棄する 。
では 、目の前 の 盤面 を どう やって 評価 する か というと 、そこ から 交互に 、完全に ランダムに 手を 指し続け 、とにかく 終局 させる のだ (これ を 「プレイアウト 」と いう )。
次に 指せる 手 が 10 手 ある と したら 、10 分 の 1 の 確率 で どれ か を 指す 。
相手 も 次 に 指せる 手 が 10 手 ある と したら 、また 10 分 の 1 の 確率 で どれ か を 指す 。
それ を 交互に 繰り返して いけば 、いずれ 勝負 が つく 。
最初の 試行 で は 自分 が 勝った けれども 、次 は 相手 の 勝利 、その 次 は 自分 ……と いう こと を 、たとえば 100 回 繰り返す 。
その 結果 、60 勝 40 敗 なら スコア は 60 点 、20 勝 80 敗 なら スコア は 20 点 、といった 具合 に 評価 する のだ 。
1 秒間 に 数 億 手 を 読む コンピュータ なら 、ある 局面 から ランダム に 指して どちら が 勝つ か を シミュレーション する こと など 、実に たやすい 。
そう やって いちいち 手 の 意味 を 考え ず 、ひたすら ランダム に 指し 続け 、その 勝率 で 盤面 を 評価 した ほうが 、人間 が スコア の つけ方 を 考え 、重みづけ を して 盤面 を 評価 する より も 、最終的に 強く なる こと が わかってきた (実際に は 完全な ランダム ではなく 、いろいろな 工夫 を している )。
素人 の 判断 (ランダム )でも 、ケタ違い に 多く なれば 、玄人 の 判断 (人間 に よる 重みづけ )に も 勝る という こと だ 。
これら の 新しい 手法 や 発見 に よって 、ゲーム を 攻略 する プログラム は どんどん 高度に なり 、時に 、人間 の 能力 を 超える ほど に なってきた 。 ただし 、その 基本 原理 は 探索 であって 、それ は 何 十 年 も 昔 から 変わって いない 。 こうした 探索 の 方法 は 、 人間 の 思考 方法 と 違って 、 ブルートフォース ( 力任せ ) と も いわ れる 。
探索 すべき 解 の 空間 が 広がる と 、この 力任せの 場合 分け は 通用 しにくく なる 。
囲碁 は 、将棋 より も さらに 盤面 の 組み合わせ が 膨大に なる ので 、人工 知能 が 人間 に 追いつく に は まだ しばらく 時間 が かかり そうだ 。
人間 の 思考 方法 を コンピュータ で 実現 し 、人間 の プロ に 勝つ に は 、第 5 章 で 出てくる ような 特徴表現学習 の 新しい 技術 が 何らかの 形で 必要 だろう 。
さぞかし コンピュータ は 賢い のだろう と 思わ れた が 、冷静に なって 考えて みる と 、この 時代 の 人工 知能 は 、非常に 限定 された 状況 で しか 問題 が 解けなかった 。
迷路 を 解く の も 、パズル を 解く の も 、チェス や 将棋 に 挑戦 する の も 、明確に 定義 された ルール の 中 で 次の 一手 を 考えれば よかった のだが 、現実 の 問題 は もっと ずっと 複雑だった 。
たとえば 、ある 人 が 病気 に なった とき に 、どんな 治療法 が ある の か 。
あるいは 、ある 会社 が これ から 伸びて いく に は どういう 製品 を 開発 したら いい か といった 、私たち が 普段 直面する ような 本当に 解きたい 問題 は 全然 解けない 。 いわゆる トイ ・プロブレム (おもちゃ の 問題 )しか 解け ない と いう こと が 次第に 明らかに なって きた 。
同時に 、 人工 知能 の 大家 である マービン ・ ミンスキー 氏 が 当時 、 一 世 を 風靡 して いた ニューラルネットワーク ( 第 4 章 で くわしく 説明 する ) に 関して 、 特定の 条件 下 に おける 限界 を 示した こと (* 注 18)( それ 自体 は 大した 限界 で は なかった のだ が 、 多く の人 は それ が ニューラルネットワーク 自体 の 限界 だ と 勘違い した )、 また 、 米国 政府 が 機械 翻訳 は 当分 成果 が 出る 見込み が ない と いう 報告 書 ( ALPAC レポート ) を 出した こと で 、 研究 の 支援 が 打ち切られた こと など が 追い打ち と なり 、 人工 知能 に 対して の 失望 感 が 広がった 。
そして 、1970年代の冬の時代を迎えてしまう。
難解な 定理 を 証明 する とか 、チェス で 勝利 する といった 高度に 専門的な 内容 は 、コンピュータ にとって は 意外に 簡単だった 。
しかし 、現実 の 問題 は 難しかった 。
人間 の 知能 を コンピュータ で 実現 する こと の 奥深さ が わかった の が 、第 1次 AI ブーム であった 。
(* 注 16) コンピュータ 将棋 や 囲碁 に 関して は 、 はこ だて 未来 大学 教授 、 現人工 知能 学会 会長 の 松原 仁 氏 が 第一人者 である 。