×

Nous utilisons des cookies pour rendre LingQ meilleur. En visitant le site vous acceptez nos Politique des cookies.


image

人工知能は人間を超えるか (Will AI surpass human?), 人工知能は人間を超えるか Chapter 02 (2)

人工 知能 は 人間 を 超える か Chapter 02 (2)

ただ 、 迷路 や パズル の 探索 と 違う の は 、 相手 が いる こと である 。

こちら が 指した 手 に 対して 、 相手 が 手 を 返して 、 さらに こちら が 手 を 指して …… と いう こと を 繰り返して 、 探索 木 を つくら ない と いけない 。

また 、 組み合わせ の 数 が とても 多く 、 すぐに 天文 学 的な 数字 に なって しまう ので 、 なかなか 最後 まで 探索 し きれ ない 。

どれ くらい の 組み合わせ が ある か と いう と 、8×8 の 盤面 で 駒 が 白黒 、 裏返し あり の オセロ は およそ 10 の 60 乗 通り ( つまり 、60 桁 の 数字 。

一 、 十 、 百 …… と 数えて いって 、 那由 他 と いう 単位 に 当たる )、8×8 の 盤面 で 駒 が 白黒 6 種類 ずつ の チェス は およそ 10 の 120 乗 通り ( もはや 大き すぎて 単位 が ない )、9×9 の 盤面 で 駒 が 8 種類 ずつ 、「 成り 」 やとった 駒 を 使える 将棋 は およそ 10 の 220 乗 通り 、19×19 の 盤面 で 駒 が 白黒 の 囲碁 は およそ 10 の 360 乗 通り である 。

つまり 、 場合 の 数 から いう と 、 オセロ が 一 番 簡単で 、 その 次に チェス 、 将棋 、 囲碁 の 順番 に 難しく なる 。

観測 可能な 宇宙 全体 の 水素 原子 の 数 が およそ 10 の 80 乗 個 と いわれて おり 、 この 数字 が この 世界 で 「 数えられる もの 」 の 数 と して は 最大 だろう から 、 盤面 で 起こり うる 組み合わせ が いかに 膨大な 数字 か 、 お わかり いただける ので は ない だろう か 。 これ だけ 組み合わせ の 数 が 膨大だ と 、 最後 まで しらみつぶし に 調べる こと は とうてい でき ない 。

そこ で 、 盤面 を 評価 する スコア を つくり 、 その スコア が よく なる ように 、 次の 指し手 を 探索 する こと に なる 。

それ が 現在 まで 続く ゲーム 攻略 の ため の 人工 知能 の 基本 的な 設計 と なって いる 。

たとえば 将棋 の 場合 、 たとえば 、 自分 の 「 王将 」 が 王手 されて いれば マイナス 10 点 、 相手 の 「 玉 将 」 に 王手 を かけて いれば プラス 10 点 、 王手 は されて い なくて も 自分 の 「 王将 」 の 周囲 8 マス に 相手 の 「 飛車 」「 角 」 が いたら マイナス 5 点 、 その 逆 が プラス 5 点 、 相手 の 「 歩 」 が 自陣 に 入り込んで きて 「 と 金 」 に 成ったら マイナス 1 点 、 その 逆 が プラス 1 点 …… の ように 決めて おく 。 その 局面 、 局面 で スコア を 計算 し 、 仮に いま が 3 点 なら 、 次の 手 で は できる だけ 3 点 より 大きく なる ように 指せば よい こと に なる 。

ゲーム は 、 自分 は 自分 の 点数 を 最大 化 ( Max ) する 手 を 指し 、 相手 は こちら の 点数 を 最小 化 ( Min ) する 手 を 指す こと で 成り立つ と 仮定 する と 、5 手先 、10 手先 の 最善 手 が 決まる 。

これ が ミニマックス 法 で 、2 手先 の 盤面 評価 から 次の 自分 の 指し手 を 決める 方法 を 次 ページ の 図 8 で 紹介 して いる 。

ついに 人類 が コンピュータ に 敗れた と いう こと で 、 世界中 に 衝撃 が 広がった 。

持ち 駒 が 使える 将棋 で コンピュータ が 人間 に 勝つ の は 当分 先 と 思われて いた が 、2012 年 、 第 1 回 将棋 電 王 戦 で 、 当時 の 日本 将棋 連盟 会長 ・ 米 長 邦雄 永世 棋聖 が 前年 の 世界 コンピュータ 将棋 選手 権 の 優勝 ソフト 「 ボンクラーズ 」 と 対戦 して 敗れた 。 その 著書 『 われ 敗れたり 』 に は 、 コンピュータ に 敗れる まで の 経緯 と 心境 が 綴られて いる (* 注 17)。 翌 2013 年 に は 、 現役 プロ 棋士 vs コンピュータソフト に よる 5 対 5 の 「 第 2 回 将棋 電 王 戦 」 が 行わ れ 、 第 2 局 で コンピュータソフト 「 ponanza 」 が 佐藤 慎一 四 段 に 勝利 、 史上 初めて 現役 プロ 棋士 が 敗れて 話題 と なった 。

対戦 成績 は ソフト 側 の 3 勝 1 敗 1 分け 、 翌 2014 年 の 「 第 3 回 将棋 電 王 戦 」 も ソフト 側 の 4 勝 1 敗 で 、 コンピュータ 有利 の 状況 が 続く 。

将棋 電 王 戦 は ニコニコ 生 放送 で 中継 さ れ 、「 人間 vs コンピュータソフト 」 と いう わかり やす さ も 手伝って 、 屈指 の 人気 コンテンツ と なった 。

なぜ 強く なって きた か と いう と 、 ひと つ は 、 コンピュータ の 処理 能力 が 飛躍 的に 向上 した こと 。

たとえば 、 第 2 回 電 王 戦 に 登場 した 「 GPS 将棋 」 は 東京 大学 に ある 670 台 の コンピュータ と 接続 し 、1 秒間 に 3億 手 読む と いわれて いた 。 将棋 の 場合 、 序盤 の 組み合わせ は それ こそ 無数に ある ため 、 どれ だけ 処理 能力 の 高い コンピュータ でも 、 すべて の 手 を 読む こと は でき ない 。

ところが 、 中盤 に なり 、 駒 の 位置 が 定まって くる に つれて 、 有効 打 の 数 は 限られて くる 。 だから 、 コンピュータ は 後 に なれば なるほど 本領 を 発揮 する 。

特に 詰め に 至る 最終 局面 で は まず ミス し ない ので 、 中盤 を いかに 戦う か が 、 将棋 ソフト と の 対戦 で は 重要に なる のだ 。

ほか に も いくつか 強く なった 秘訣 は ある のだ が 、 ここ で は 2 つ だけ ご 紹介 しよう 。 機械 学習 に よって 、 盤面 と 指す べき 手 を 過去 の 膨大な 棋譜 から 学習 する こと が できる ように なった 。

そして 、 そこ に 新しい 特徴 量 を 使えば いい こと が わかって きた のだ 。

特徴 量 と いう の は 「 データ の 中 の どこ に 注目 する か 」 と いう こと であって 、 それ に よって 、 プログラム の 挙動 が 変化 する 。

たとえば 、「 王手 を されて いる か 」 と いう の は 1 つ の 特徴 量 だ し 、「 王将 が どの くらい 前 に 出て いる か 」 と いう の も 1 つ の 特徴 量 である 。 以前 は 、 機械 学習 で 使う 特徴 量 は 、 あくまで 「2 つ の 駒 の 関係 」 が 中心 だった 。

王将 に 対して 飛車 が この 位置 に ある と か 、 金 が 王手 を かけて いる と か 、2 つ の 駒 の 位置 関係 に 注目 して 、 指す べき 手 を 計算 して いた 。

ところが 、 研究 が 進む に つれて 、 徐々に 「3 つ の 駒 の 関係 」 を 使った ほう が 有効だ と いう こと が わかって きた 。

たとえば 、 王将 と 金 と 銀 の 位置 関係 が どう なれば 有利な の か 、 人間 に は 見えて い なかった 相関 関係 を 、 過去 の 棋譜 と いう ビッグ データ の 中 から 見つけ出し 、 それ に よって 次の 指し手 を 絞る とき の 精度 が 向上 した のだ 。

それ まで は 、 それぞれ の 駒 の 数 や 位置 関係 に 点数 を つけて 盤面 を 評価 して いた のだ が 、 その 点数 の つけ 方 が 妙味 であって 、 極端な 話 、 ある 局面 を どういうふうに 評価 する か に よって 、 ソフト の 強 さ が 決まって いた 。

点数 の つけ 方 は 、 あくまでも 人間 が 決めて いた のだ 。

ところが 、 モンテカルロ 法 で は 180 度 発想 を 変えて 、 ある 局面 まで きたら 、 駒 の 数 や 位置 関係 に よって 点数 を つける こと を 放棄 する 。

では 、 目の前 の 盤面 を どう やって 評価 する か と いう と 、 そこ から 交互に 、 完全に ラン ダム に 手 を 指し 続け 、 とにかく 終局 さ せる のだ ( これ を 「 プレイアウト 」 と いう )。

次に 指せる 手 が 10 手 ある と したら 、10 分 の 1 の 確率 で どれ か を 指す 。

相手 も 次に 指せる 手 が 10 手 ある と したら 、 また 10 分 の 1 の 確率 で どれ か を 指す 。

それ を 交互に 繰り返して いけば 、 いずれ 勝負 が つく 。

最初の 試行 で は 自分 が 勝った けれども 、 次 は 相手 の 勝利 、 その 次 は 自分 …… と いう こと を 、 たとえば 100 回 繰り返す 。

その 結果 、60 勝 40 敗 なら スコア は 60 点 、20 勝 80 敗 なら スコア は 20 点 、 と いった 具合 に 評価 する のだ 。

1 秒間 に 数 億 手 を 読む コンピュータ なら 、 ある 局面 から ラン ダム に 指して どちら が 勝つ か を シミュレーション する こと など 、 実に たやすい 。

そう やって いちいち 手 の 意味 を 考え ず 、 ひたすら ラン ダム に 指し 続け 、 その 勝率 で 盤面 を 評価 した ほう が 、 人間 が スコア の つけ 方 を 考え 、 重み づけ を して 盤面 を 評価 する より も 、 最終 的に 強く なる こと が わかって きた ( 実際 に は 完全な ラン ダム で は なく 、 いろいろな 工夫 を して いる )。

素人 の 判断 ( ラン ダム ) でも 、 ケタ違いに 多く なれば 、 玄人 の 判断 ( 人間 に よる 重み づけ ) に も 勝る と いう こと だ 。

これら の 新しい 手法 や 発見 に よって 、 ゲーム を 攻略 する プログラム は どんどん 高度に なり 、 時に 、 人間 の 能力 を 超える ほど に なって きた 。 ただし 、 その 基本 原理 は 探索 であって 、 それ は 何 十 年 も 昔 から 変わって いない 。 こうした 探索 の 方法 は 、 人間 の 思考 方法 と 違って 、 ブルートフォース ( 力任せ ) と も いわ れる 。

探索 す べき 解 の 空間 が 広がる と 、 この 力任せの 場合 分け は 通用 し にくく なる 。

囲碁 は 、 将棋 より も さらに 盤面 の 組み合わせ が 膨大に なる ので 、 人工 知能 が 人間 に 追いつく に は まだ しばらく 時間 が かかり そうだ 。

人間 の 思考 方法 を コンピュータ で 実現 し 、 人間 の プロ に 勝つ に は 、 第 5 章 で 出て くる ような 特徴 表現 学習 の 新しい 技術 が 何らか の 形 で 必要だろう 。

さぞかし コンピュータ は 賢い のだろう と 思わ れた が 、 冷静に なって 考えて みる と 、 この 時代 の 人工 知能 は 、 非常に 限定 さ れた 状況 で しか 問題 が 解け なかった 。

迷路 を 解く の も 、 パズル を 解く の も 、 チェス や 将棋 に 挑戦 する の も 、 明確に 定義 さ れた ルール の 中 で 次の 一 手 を 考えれば よかった のだ が 、 現実 の 問題 は もっと ずっと 複雑だった 。

たとえば 、 ある 人 が 病気 に なった とき に 、 どんな 治療 法 が ある の か 。

あるいは 、 ある 会社 が これ から 伸びて いく に は どういう 製品 を 開発 したら いい か と いった 、 私 たち が 普段 直面 する ような 本当に 解きたい 問題 は 全然 解け ない 。 いわゆる トイ ・ プロブレム ( おもちゃ の 問題 ) しか 解け ない と いう こと が 次第に 明らかに なって きた 。

同時に 、 人工 知能 の 大家 である マービン ・ ミンスキー 氏 が 当時 、 一 世 を 風靡 して いた ニューラルネットワーク ( 第 4 章 で くわしく 説明 する ) に 関して 、 特定の 条件 下 に おける 限界 を 示した こと (* 注 18)( それ 自体 は 大した 限界 で は なかった のだ が 、 多く の 人 は それ が ニューラルネットワーク 自体 の 限界 だ と 勘違い した )、 また 、 米国 政府 が 機械 翻訳 は 当分 成果 が 出る 見込み が ない と いう 報告 書 ( ALPAC レポート ) を 出した こと で 、 研究 の 支援 が 打ち切ら れた こと など が 追い打ち と なり 、 人工 知能 に 対して の 失望 感 が 広がった 。

そして 、1970 年 代 の 冬 の 時代 を 迎えて しまう 。

難解な 定理 を 証明 する と か 、 チェス で 勝利 する と いった 高度に 専門 的な 内容 は 、 コンピュータ に とって は 意外に 簡単だった 。

しかし 、 現実 の 問題 は 難しかった 。

人間 の 知能 を コンピュータ で 実現 する こと の 奥深 さ が わかった の が 、 第 1 次 AI ブーム であった 。

(* 注 16) コンピュータ 将棋 や 囲碁 に 関して は 、 はこ だて 未来 大学 教授 、 現 人工 知能 学会 会長 の 松原 仁 氏 が 第一人者 である 。


人工 知能 は 人間 を 超える か Chapter 02 (2) じんこう|ちのう||にんげん||こえる||chapter Will Artificial Intelligence Surpass Humans Chapter 02 (2) L'intelligence artificielle dépassera-t-elle l'homme ? Chapitre 02 (2) A inteligência artificial ultrapassará o ser humano Capítulo 02 (2)

ただ 、 迷路 や パズル の 探索 と 違う の は 、 相手 が いる こと である 。 |めいろ||ぱずる||たんさく||ちがう|||あいて|||| However, what is different from exploring mazes and puzzles is that there is an opponent.

こちら が 指した 手 に 対して 、 相手 が 手 を 返して 、 さらに こちら が 手 を 指して …… と いう こと を 繰り返して 、 探索 木 を つくら ない と いけない 。 ||さした|て||たいして|あいて||て||かえして||||て||さして|||||くりかえして|たんさく|き||||| For the hand that we pointed to, the other person returned the hand, and then this pointed to the hand, and so on, and so on, and so on, and the search tree had to be struck.

また 、 組み合わせ の 数 が とても 多く 、 すぐに 天文 学 的な 数字 に なって しまう ので 、 なかなか 最後 まで 探索 し きれ ない 。 |くみあわせ||すう|||おおく||てんもん|まな|てきな|すうじ||||||さいご||たんさく||| Also, the number of combinations is so large that it quickly becomes an astronomical number, so it is difficult to search to the end.

どれ くらい の 組み合わせ が ある か と いう と 、8×8 の 盤面 で 駒 が 白黒 、 裏返し あり の オセロ は およそ 10 の 60 乗 通り ( つまり 、60 桁 の 数字 。 |||くみあわせ||||||||ばんめん||こま||しろくろ|うらがえし|||||||じょう|とおり||けた||すうじ The number of combinations is that on an 8x8 board, the pieces are black and white, and the Othello with the inside out is about 10 to the 60th power (that is, a 60-digit number).

一 、 十 、 百 …… と 数えて いって 、 那由 他 と いう 単位 に 当たる )、8×8 の 盤面 で 駒 が 白黒 6 種類 ずつ の チェス は およそ 10 の 120 乗 通り ( もはや 大き すぎて 単位 が ない )、9×9 の 盤面 で 駒 が 8 種類 ずつ 、「 成り 」 やとった 駒 を 使える 将棋 は およそ 10 の 220 乗 通り 、19×19 の 盤面 で 駒 が 白黒 の 囲碁 は およそ 10 の 360 乗 通り である 。 ひと|じゅう|ひゃく||かぞえて||なゆ|た|||たんい||あたる||ばんめん||こま||しろくろ|しゅるい|||||||じょう|とおり||おおき||たんい||||ばんめん||こま||しゅるい||なり||こま||つかえる|しょうぎ||||じょう|とおり||ばんめん||こま||しろくろ||いご||||じょう|とおり| Counting one, ten, one hundred, etc., it corresponds to a unit called Decillion, etc.), chess with 6 types of black and white pieces on an 8x8 board is about 10 to the 120th power (it is no longer too big and the unit is No), 8 types of pieces on a 9x9 board, 8 types of pieces can be used, and the number of shogi that can be used is about 10 to the 220th power. It's a street.

つまり 、 場合 の 数 から いう と 、 オセロ が 一 番 簡単で 、 その 次に チェス 、 将棋 、 囲碁 の 順番 に 難しく なる 。 |ばあい||すう||||||ひと|ばん|かんたんで||つぎに||しょうぎ|いご||じゅんばん||むずかしく| In other words, in terms of the number of cases, Othello is the easiest, followed by chess, shogi, and go.

観測 可能な 宇宙 全体 の 水素 原子 の 数 が およそ 10 の 80 乗 個 と いわれて おり 、 この 数字 が この 世界 で 「 数えられる もの 」 の 数 と して は 最大 だろう から 、 盤面 で 起こり うる 組み合わせ が いかに 膨大な 数字 か 、 お わかり いただける ので は ない だろう か 。 かんそく|かのうな|うちゅう|ぜんたい||すいそ|げんし||すう||||じょう|こ||いわ れて|||すうじ|||せかい||かぞえ られる|||すう||||さいだい|||ばんめん||おこり||くみあわせ|||ぼうだいな|すうじ||||||||| Since the number of hydrogen atoms in the entire observable universe is said to be approximately 10 to the 80th power, which is probably the largest number of "countable things" in the world, you can understand the enormous number of possible combinations that could occur on the board. これ だけ 組み合わせ の 数 が 膨大だ と 、 最後 まで しらみつぶし に 調べる こと は とうてい でき ない 。 ||くみあわせ||すう||ぼうだいだ||さいご||||しらべる||||| With such a huge number of combinations, it is almost impossible to scrutinize to the end.

そこ で 、 盤面 を 評価 する スコア を つくり 、 その スコア が よく なる ように 、 次の 指し手 を 探索 する こと に なる 。 ||ばんめん||ひょうか||すこあ||||すこあ|||||つぎの|さして||たんさく|||| We then evaluate the board, form a score, and search for the next move that will improve the score.

それ が 現在 まで 続く ゲーム 攻略 の ため の 人工 知能 の 基本 的な 設計 と なって いる 。 ||げんざい||つづく|げーむ|こうりゃく||||じんこう|ちのう||きほん|てきな|せっけい||| That is the basic design of artificial intelligence for the game strategy that continues to this day.

たとえば 将棋 の 場合 、 たとえば 、 自分 の 「 王将 」 が 王手 されて いれば マイナス 10 点 、 相手 の 「 玉 将 」 に 王手 を かけて いれば プラス 10 点 、 王手 は されて い なくて も 自分 の 「 王将 」 の 周囲 8 マス に 相手 の 「 飛車 」「 角 」 が いたら マイナス 5 点 、 その 逆 が プラス 5 点 、 相手 の 「 歩 」 が 自陣 に 入り込んで きて 「 と 金 」 に 成ったら マイナス 1 点 、 その 逆 が プラス 1 点 …… の ように 決めて おく 。 |しょうぎ||ばあい||じぶん||おうしょう||おうて|さ れて||まいなす|てん|あいて||たま|すすむ||おうて||||ぷらす|てん|おうて||さ れて||||じぶん||おうしょう||しゅうい|ます||あいて||ひしゃ|かど|||まいなす|てん||ぎゃく||ぷらす|てん|あいて||ふ||じじん||はいりこんで|||きむ||なったら|まいなす|てん||ぎゃく||ぷらす|てん|||きめて| For example, in the case of shogi, for example, if your "king" is a check, you will get minus 10 points, if you put a check on your opponent's "king", you will get a plus 10 points. If the opponent's "Rook" and "Kaku" are in the 8 squares around the "King", minus 5 points, vice versa, plus 5 points, and if the opponent's "walk" enters your own team and becomes "and money", minus 1 point. , The opposite is plus 1 point ……. その 局面 、 局面 で スコア を 計算 し 、 仮に いま が 3 点 なら 、 次の 手 で は できる だけ 3 点 より 大きく なる ように 指せば よい こと に なる 。 |きょくめん|きょくめん||すこあ||けいさん||かりに|||てん||つぎの|て|||||てん||おおきく|||させば|||| In that phase, the score is calculated in that phase, and if you have 3 points now, you should point to it so that it will be as large as 3 points in the next move.

ゲーム は 、 自分 は 自分 の 点数 を 最大 化 ( Max ) する 手 を 指し 、 相手 は こちら の 点数 を 最小 化 ( Min ) する 手 を 指す こと で 成り立つ と 仮定 する と 、5 手先 、10 手先 の 最善 手 が 決まる 。 げーむ||じぶん||じぶん||てんすう||さいだい|か|max||て||さし|あいて||||てんすう||さいしょう|か|min||て||さす|||なりたつ||かてい|||てさき|てさき||さいぜん|て||きまる Assuming that the game consists of pointing to the hand that maximizes (Max) one's score and the opponent pointing to the hand that minimizes (Min) this score, the best move of 5, 10 and 10 moves. Is decided.

これ が ミニマックス 法 で 、2 手先 の 盤面 評価 から 次の 自分 の 指し手 を 決める 方法 を 次 ページ の 図 8 で 紹介 して いる 。 |||ほう||てさき||ばんめん|ひょうか||つぎの|じぶん||さして||きめる|ほうほう||つぎ|ぺーじ||ず||しょうかい|| Figure 8 on the next page shows how the minimax method determines the next move based on the board evaluation two moves ahead.

ついに 人類 が コンピュータ に 敗れた と いう こと で 、 世界中 に 衝撃 が 広がった 。 |じんるい||こんぴゅーた||やぶれた|||||せかいじゅう||しょうげき||ひろがった The shock was spread all over the world when human beings were finally defeated by computers.

持ち 駒 が 使える 将棋 で コンピュータ が 人間 に 勝つ の は 当分 先 と 思われて いた が 、2012 年 、 第 1 回 将棋 電 王 戦 で 、 当時 の 日本 将棋 連盟 会長 ・ 米 長 邦雄 永世 棋聖 が 前年 の 世界 コンピュータ 将棋 選手 権 の 優勝 ソフト 「 ボンクラーズ 」 と 対戦 して 敗れた 。 もち|こま||つかえる|しょうぎ||こんぴゅーた||にんげん||かつ|||とうぶん|さき||おもわ れて|||とし|だい|かい|しょうぎ|いなずま|おう|いくさ||とうじ||にっぽん|しょうぎ|れんめい|かいちょう|べい|ちょう|くにお|えいせい|きせい||ぜんねん||せかい|こんぴゅーた|しょうぎ|せんしゅ|けん||ゆうしょう|そふと|||たいせん||やぶれた It was thought that computers could beat humans in shogi that can use their own pieces for the time being, but in 2012, at the 1st Shogi Den-O War, the chairman of the Japan Shogi Association at that time, Kunio Yonenaga, was the previous year. Computer Shogi player was defeated in a match against the winning software "Bonclaws". その 著書 『 われ 敗れたり 』 に は 、 コンピュータ に 敗れる まで の 経緯 と 心境 が 綴られて いる (* 注 17)。 |ちょしょ||やぶれたり|||こんぴゅーた||やぶれる|||けいい||しんきょう||つづら れて||そそ In his book, "We are defeated," the process and feelings leading up to the loss to the computer are described (* Note 17). 翌 2013 年 に は 、 現役 プロ 棋士 vs コンピュータソフト に よる 5 対 5 の 「 第 2 回 将棋 電 王 戦 」 が 行わ れ 、 第 2 局 で コンピュータソフト 「 ponanza 」 が 佐藤 慎一 四 段 に 勝利 、 史上 初めて 現役 プロ 棋士 が 敗れて 話題 と なった 。 よく|とし|||げんえき|ぷろ|きし|||||たい||だい|かい|しょうぎ|いなずま|おう|いくさ||おこなわ||だい|きょく|||||さとう|しんいち|よっ|だん||しょうり|しじょう|はじめて|げんえき|ぷろ|きし||やぶれて|わだい|| The following year, in 2013, a 5 to 5 "2nd Shogi Den-Ohsen" was held by an active professional shogi player vs. computer software, and the computer software "ponanza" won the 4th stage of Shinichi Sato for the first time in history. An active professional shogi player was defeated and became a hot topic.

対戦 成績 は ソフト 側 の 3 勝 1 敗 1 分け 、 翌 2014 年 の 「 第 3 回 将棋 電 王 戦 」 も ソフト 側 の 4 勝 1 敗 で 、 コンピュータ 有利 の 状況 が 続く 。 たいせん|せいせき||そふと|がわ||か|はい|わけ|よく|とし||だい|かい|しょうぎ|いなずま|おう|いくさ||そふと|がわ||か|はい||こんぴゅーた|ゆうり||じょうきょう||つづく The results of the match were 3 wins, 1 loss and 1 draw on the soft side, and the following 2014 "3rd Shogi Den-O Battle" was also 4 wins and 1 loss on the soft side, and the situation of computer advantage continues.

将棋 電 王 戦 は ニコニコ 生 放送 で 中継 さ れ 、「 人間 vs コンピュータソフト 」 と いう わかり やす さ も 手伝って 、 屈指 の 人気 コンテンツ と なった 。 しょうぎ|いなずま|おう|いくさ||にこにこ|せい|ほうそう||ちゅうけい|||にんげん|||||||||てつだって|くっし||にんき|こんてんつ|| The Shogi Den-O War was broadcast live on NicoNico, and with the help of the easy-to-understand "human vs. computer software," it became one of the most popular contents.

なぜ 強く なって きた か と いう と 、 ひと つ は 、 コンピュータ の 処理 能力 が 飛躍 的に 向上 した こと 。 |つよく||||||||||こんぴゅーた||しょり|のうりょく||ひやく|てきに|こうじょう|| One of the reasons why it has become stronger is that the processing power of computers has improved dramatically.

たとえば 、 第 2 回 電 王 戦 に 登場 した 「 GPS 将棋 」 は 東京 大学 に ある 670 台 の コンピュータ と 接続 し 、1 秒間 に 3億 手 読む と いわれて いた 。 |だい|かい|いなずま|おう|いくさ||とうじょう||gps|しょうぎ||とうきょう|だいがく|||だい||こんぴゅーた||せつぞく||びょうかん||おく|て|よむ||いわ れて| For example, the "GPS Shogi" that appeared in the 2nd Den-O War was said to be connected to 670 computers at the University of Tokyo and read 300 million hands per second. 将棋 の 場合 、 序盤 の 組み合わせ は それ こそ 無数に ある ため 、 どれ だけ 処理 能力 の 高い コンピュータ でも 、 すべて の 手 を 読む こと は でき ない 。 しょうぎ||ばあい|じょばん||くみあわせ||||むすうに|||||しょり|のうりょく||たかい|こんぴゅーた||||て||よむ|||| In the case of shogi, the number of early combinations is so numerous that even the most powerful computer cannot read every hand.

ところが 、 中盤 に なり 、 駒 の 位置 が 定まって くる に つれて 、 有効 打 の 数 は 限られて くる 。 |ちゅうばん|||こま||いち||さだまって||||ゆうこう|だ||すう||かぎら れて| However, the number of effective hits becomes limited as the position of the piece is fixed in the middle stage. だから 、 コンピュータ は 後 に なれば なるほど 本領 を 発揮 する 。 |こんぴゅーた||あと||||ほんりょう||はっき| That's why computers do their best at a later date.

特に 詰め に 至る 最終 局面 で は まず ミス し ない ので 、 中盤 を いかに 戦う か が 、 将棋 ソフト と の 対戦 で は 重要に なる のだ 。 とくに|つめ||いたる|さいしゅう|きょくめん||||みす||||ちゅうばん|||たたかう|||しょうぎ|そふと|||たいせん|||じゅうように|| Especially in the final phase of the game, we make no mistakes, so how to fight in the middle of the game is important in the game against shogi software.

ほか に も いくつか 強く なった 秘訣 は ある のだ が 、 ここ で は 2 つ だけ ご 紹介 しよう 。 |||いく つ か|つよく||ひけつ|||||||||||しょうかい| There are some other secrets that have become stronger, but here are just two. 機械 学習 に よって 、 盤面 と 指す べき 手 を 過去 の 膨大な 棋譜 から 学習 する こと が できる ように なった 。 きかい|がくしゅう|||ばんめん||さす||て||かこ||ぼうだいな|きふ||がくしゅう|||||| Machine learning has made it possible to learn the hand that should be referred to as the board from the huge number of game records in the past.

そして 、 そこ に 新しい 特徴 量 を 使えば いい こと が わかって きた のだ 。 |||あたらしい|とくちょう|りょう||つかえば|||||| And I realized that I should use a new feature there.

特徴 量 と いう の は 「 データ の 中 の どこ に 注目 する か 」 と いう こと であって 、 それ に よって 、 プログラム の 挙動 が 変化 する 。 とくちょう|りょう|||||でーた||なか||||ちゅうもく||||||||||ぷろぐらむ||きょどう||へんか| The feature quantity is "where in the data to focus on", and the behavior of the program changes accordingly.

たとえば 、「 王手 を されて いる か 」 と いう の は 1 つ の 特徴 量 だ し 、「 王将 が どの くらい 前 に 出て いる か 」 と いう の も 1 つ の 特徴 量 である 。 |おうて||さ れて|||||||||とくちょう|りょう|||おうしょう||||ぜん||でて|||||||||とくちょう|りょう| For example, "Are you a checker?" Is one feature, and "How long ago the king has come out" is one feature. 以前 は 、 機械 学習 で 使う 特徴 量 は 、 あくまで 「2 つ の 駒 の 関係 」 が 中心 だった 。 いぜん||きかい|がくしゅう||つかう|とくちょう|りょう|||||こま||かんけい||ちゅうしん| Previously, the features used in machine learning were mainly "relationship between two pieces".

王将 に 対して 飛車 が この 位置 に ある と か 、 金 が 王手 を かけて いる と か 、2 つ の 駒 の 位置 関係 に 注目 して 、 指す べき 手 を 計算 して いた 。 おうしょう||たいして|ひしゃ|||いち|||||きむ||おうて||||||||こま||いち|かんけい||ちゅうもく||さす||て||けいさん|| He calculated the hand to point to by paying attention to the positional relationship between the two pieces, such as the rook being in this position with respect to the king, and the money being hung on the check.

ところが 、 研究 が 進む に つれて 、 徐々に 「3 つ の 駒 の 関係 」 を 使った ほう が 有効だ と いう こと が わかって きた 。 |けんきゅう||すすむ|||じょじょに|||こま||かんけい||つかった|||ゆうこうだ|||||| However, as the research progressed, it gradually became clear that it was more effective to use the "relationship of three pieces".

たとえば 、 王将 と 金 と 銀 の 位置 関係 が どう なれば 有利な の か 、 人間 に は 見えて い なかった 相関 関係 を 、 過去 の 棋譜 と いう ビッグ データ の 中 から 見つけ出し 、 それ に よって 次の 指し手 を 絞る とき の 精度 が 向上 した のだ 。 |おうしょう||きむ||ぎん||いち|かんけい||||ゆうりな|||にんげん|||みえて|||そうかん|かんけい||かこ||きふ|||びっぐ|でーた||なか||みつけだし||||つぎの|さして||しぼる|||せいど||こうじょう|| For example, what is the advantage of the positional relationship between the king, gold, and silver, and the correlation that was not visible to humans, was found in the big data called the past game record, and the next move was made accordingly. The accuracy when squeezing has improved.

それ まで は 、 それぞれ の 駒 の 数 や 位置 関係 に 点数 を つけて 盤面 を 評価 して いた のだ が 、 その 点数 の つけ 方 が 妙味 であって 、 極端な 話 、 ある 局面 を どういうふうに 評価 する か に よって 、 ソフト の 強 さ が 決まって いた 。 |||||こま||すう||いち|かんけい||てんすう|||ばんめん||ひょうか||||||てんすう|||かた||みょうみ||きょくたんな|はなし||きょくめん|||ひょうか|||||そふと||つよ|||きまって| Until then, the board was evaluated by giving points to the number and positional relationship of each piece, but the way to give the points was interesting, and how to evaluate an extreme story and a certain situation. Therefore, the strength of the software was decided.

点数 の つけ 方 は 、 あくまでも 人間 が 決めて いた のだ 。 てんすう|||かた|||にんげん||きめて|| The way of scoring was decided by human beings.

ところが 、 モンテカルロ 法 で は 180 度 発想 を 変えて 、 ある 局面 まで きたら 、 駒 の 数 や 位置 関係 に よって 点数 を つける こと を 放棄 する 。 |もんてかるろ|ほう|||たび|はっそう||かえて||きょくめん|||こま||すう||いち|かんけい|||てんすう|||||ほうき| However, in the Monte Carlo method, the idea is changed by 180 degrees, and when a certain situation is reached, the score is abandoned according to the number of pieces and the positional relationship.

では 、 目の前 の 盤面 を どう やって 評価 する か と いう と 、 そこ から 交互に 、 完全に ラン ダム に 手 を 指し 続け 、 とにかく 終局 さ せる のだ ( これ を 「 プレイアウト 」 と いう )。 |めのまえ||ばんめん||||ひょうか||||||||こうごに|かんぜんに|らん|だむ||て||さし|つづけ||しゅうきょく|||||||| Then, how to evaluate the board in front of us is to, alternately, keep pointing to the random completely and let it end anyway (this is called "playout").

次に 指せる 手 が 10 手 ある と したら 、10 分 の 1 の 確率 で どれ か を 指す 。 つぎに|させる|て||て||||ぶん|||かくりつ|||||さす If there are 10 hands that can be pointed next, point to one with a probability of 1 in 10 minutes.

相手 も 次に 指せる 手 が 10 手 ある と したら 、 また 10 分 の 1 の 確率 で どれ か を 指す 。 あいて||つぎに|させる|て||て|||||ぶん|||かくりつ|||||さす If the other party also has 10 moves to point to next, it also points to one with a probability of 1 in 10 minutes.

それ を 交互に 繰り返して いけば 、 いずれ 勝負 が つく 。 ||こうごに|くりかえして|||しょうぶ|| If you repeat it alternately, you will eventually win the game.

最初の 試行 で は 自分 が 勝った けれども 、 次 は 相手 の 勝利 、 その 次 は 自分 …… と いう こと を 、 たとえば 100 回 繰り返す 。 さいしょの|しこう|||じぶん||かった||つぎ||あいて||しょうり||つぎ||じぶん||||||かい|くりかえす In the first attempt, you win, but then your opponent wins, then you ... and so on, for example 100 times.

その 結果 、60 勝 40 敗 なら スコア は 60 点 、20 勝 80 敗 なら スコア は 20 点 、 と いった 具合 に 評価 する のだ 。 |けっか|か|はい||すこあ||てん|か|はい||すこあ||てん|||ぐあい||ひょうか|| As a result, the score is 60 points for 60 wins and 40 losses, the score is 20 points for 20 wins and 80 losses, and so on.

1 秒間 に 数 億 手 を 読む コンピュータ なら 、 ある 局面 から ラン ダム に 指して どちら が 勝つ か を シミュレーション する こと など 、 実に たやすい 。 びょうかん||すう|おく|て||よむ|こんぴゅーた|||きょくめん||らん|だむ||さして|||かつ|||しみゅれーしょん||||じつに| With a computer that reads hundreds of millions of moves per second, it's really easy to point to a random point from a certain point and simulate which one wins.

そう やって いちいち 手 の 意味 を 考え ず 、 ひたすら ラン ダム に 指し 続け 、 その 勝率 で 盤面 を 評価 した ほう が 、 人間 が スコア の つけ 方 を 考え 、 重み づけ を して 盤面 を 評価 する より も 、 最終 的に 強く なる こと が わかって きた ( 実際 に は 完全な ラン ダム で は なく 、 いろいろな 工夫 を して いる )。 |||て||いみ||かんがえ|||らん|だむ||さし|つづけ||しょうりつ||ばんめん||ひょうか||||にんげん||すこあ|||かた||かんがえ|おもみ||||ばんめん||ひょうか||||さいしゅう|てきに|つよく||||||じっさい|||かんぜんな|らん|だむ|||||くふう||| Instead of thinking about the meaning of each hand, it is better to continue pointing to the random and evaluate the board based on the winning percentage, rather than having humans think about how to score and evaluate the board by weighting it. It has been found that it will become stronger (actually, it is not a perfect randomness, but various ideas have been devised).

素人 の 判断 ( ラン ダム ) でも 、 ケタ違いに 多く なれば 、 玄人 の 判断 ( 人間 に よる 重み づけ ) に も 勝る と いう こと だ 。 しろうと||はんだん|らん|だむ||けたちがいに|おおく||くろうと||はんだん|にんげん|||おもみ||||まさる|||| Even an amateur's judgment (Random) means that if the number of digits increases, the judgment of the expert (weighting by humans) will be better.

これら の 新しい 手法 や 発見 に よって 、 ゲーム を 攻略 する プログラム は どんどん 高度に なり 、 時に 、 人間 の 能力 を 超える ほど に なって きた 。 これ ら||あたらしい|しゅほう||はっけん|||げーむ||こうりゃく||ぷろぐらむ|||こうどに||ときに|にんげん||のうりょく||こえる|||| With these new techniques and discoveries, the programs that capture the game have become more and more sophisticated, and at times, beyond the capabilities of humans. ただし 、 その 基本 原理 は 探索 であって 、 それ は 何 十 年 も 昔 から 変わって いない 。 ||きほん|げんり||たんさく||||なん|じゅう|とし||むかし||かわって| However, its basic principle is exploration, which has not changed for decades. こうした 探索 の 方法 は 、 人間 の 思考 方法 と 違って 、 ブルートフォース ( 力任せ ) と も いわ れる 。 |たんさく||ほうほう||にんげん||しこう|ほうほう||ちがって||ちからまかせ|||| This method of exploration, unlike the way humans think, is also called brute force.

探索 す べき 解 の 空間 が 広がる と 、 この 力任せの 場合 分け は 通用 し にくく なる 。 たんさく|||かい||くうかん||ひろがる|||ちからまかせの|ばあい|わけ||つうよう||| As the space for the solution to be searched expands, it becomes difficult to make a distinction in this brute force case.

囲碁 は 、 将棋 より も さらに 盤面 の 組み合わせ が 膨大に なる ので 、 人工 知能 が 人間 に 追いつく に は まだ しばらく 時間 が かかり そうだ 。 いご||しょうぎ||||ばんめん||くみあわせ||ぼうだいに|||じんこう|ちのう||にんげん||おいつく|||||じかん|||そう だ Go has a huge number of board combinations compared to shogi, so it seems that it will take some time for artificial intelligence to catch up with humans.

人間 の 思考 方法 を コンピュータ で 実現 し 、 人間 の プロ に 勝つ に は 、 第 5 章 で 出て くる ような 特徴 表現 学習 の 新しい 技術 が 何らか の 形 で 必要だろう 。 にんげん||しこう|ほうほう||こんぴゅーた||じつげん||にんげん||ぷろ||かつ|||だい|しょう||でて|||とくちょう|ひょうげん|がくしゅう||あたらしい|ぎじゅつ||なんらか||かた||ひつようだろう In order to realize the way of thinking of human beings on a computer and to beat the professionals of human beings, some form of new technology of feature expression learning as described in Chapter 5 will be needed.

さぞかし コンピュータ は 賢い のだろう と 思わ れた が 、 冷静に なって 考えて みる と 、 この 時代 の 人工 知能 は 、 非常に 限定 さ れた 状況 で しか 問題 が 解け なかった 。 |こんぴゅーた||かしこい|||おもわ|||れいせいに||かんがえて||||じだい||じんこう|ちのう||ひじょうに|げんてい|||じょうきょう|||もんだい||とけ| It seemed that computers were smart, but when I thought about it calmly, artificial intelligence in this era could only be solved in very limited situations.

迷路 を 解く の も 、 パズル を 解く の も 、 チェス や 将棋 に 挑戦 する の も 、 明確に 定義 さ れた ルール の 中 で 次の 一 手 を 考えれば よかった のだ が 、 現実 の 問題 は もっと ずっと 複雑だった 。 めいろ||とく|||ぱずる||とく|||||しょうぎ||ちょうせん||||めいかくに|ていぎ|||るーる||なか||つぎの|ひと|て||かんがえれば||||げんじつ||もんだい||||ふくざつだった Whether it's solving a maze, solving a puzzle, or challenging chess or shogi, I wish I had considered the next move within well-defined rules, but the real problem is much more complicated. was .

たとえば 、 ある 人 が 病気 に なった とき に 、 どんな 治療 法 が ある の か 。 ||じん||びょうき||||||ちりょう|ほう|||| For example, if a person is ill, what kind of treatment is available?

あるいは 、 ある 会社 が これ から 伸びて いく に は どういう 製品 を 開発 したら いい か と いった 、 私 たち が 普段 直面 する ような 本当に 解きたい 問題 は 全然 解け ない 。 ||かいしゃ||||のびて|||||せいひん||かいはつ||||||わたくし|||ふだん|ちょくめん|||ほんとうに|とき たい|もんだい||ぜんぜん|とけ| Or, we can't solve the problems we usually face that we really want to solve, such as what kind of products a company should develop in order to grow in the future. いわゆる トイ ・ プロブレム ( おもちゃ の 問題 ) しか 解け ない と いう こと が 次第に 明らかに なって きた 。 |||||もんだい||とけ||||||しだいに|あきらかに|| It is becoming increasingly clear that only the so-called toy problem (toy problem) can be solved.

同時に 、 人工 知能 の 大家 である マービン ・ ミンスキー 氏 が 当時 、 一 世 を 風靡 して いた ニューラルネットワーク ( 第 4 章 で くわしく 説明 する ) に 関して 、 特定の 条件 下 に おける 限界 を 示した こと (* 注 18)( それ 自体 は 大した 限界 で は なかった のだ が 、 多く の 人 は それ が ニューラルネットワーク 自体 の 限界 だ と 勘違い した )、 また 、 米国 政府 が 機械 翻訳 は 当分 成果 が 出る 見込み が ない と いう 報告 書 ( ALPAC レポート ) を 出した こと で 、 研究 の 支援 が 打ち切ら れた こと など が 追い打ち と なり 、 人工 知能 に 対して の 失望 感 が 広がった 。 どうじに|じんこう|ちのう||たいか||||うじ||とうじ|ひと|よ||ふうび||||だい|しょう|||せつめい|||かんして|とくていの|じょうけん|した|||げんかい||しめした||そそ||じたい||たいした|げんかい||||||おおく||じん|||||じたい||げんかい|||かんちがい|||べいこく|せいふ||きかい|ほんやく||とうぶん|せいか||でる|みこみ|||||ほうこく|しょ|alpac|れぽーと||だした|||けんきゅう||しえん||うちきら|||||おいうち|||じんこう|ちのう||たいして||しつぼう|かん||ひろがった At the same time, artificial intelligence master Marvin Minsky showed the limits under certain conditions regarding neural networks (detailed in Chapter 4), which were predominant at the time (*). Note 18) (Although it wasn't a big limit in itself, many people mistakenly thought it was the limit of the neural network itself), and the U.S. government is unlikely to see any immediate results in machine translation. With the issuance of the report (ALPAC Report), the discontinuation of research support was added to the situation, and disappointment with artificial intelligence spread.

そして 、1970 年 代 の 冬 の 時代 を 迎えて しまう 。 |とし|だい||ふゆ||じだい||むかえて| Then came the winter of the 1970s.

難解な 定理 を 証明 する と か 、 チェス で 勝利 する と いった 高度に 専門 的な 内容 は 、 コンピュータ に とって は 意外に 簡単だった 。 なんかいな|ていり||しょうめい||||||しょうり||||こうどに|せんもん|てきな|ないよう||こんぴゅーた||||いがいに|かんたんだった Highly technical subjects such as proving a difficult theorem or winning a game of chess were surprisingly easy for the computer.

しかし 、 現実 の 問題 は 難しかった 。 |げんじつ||もんだい||むずかしかった However, the reality of the problem was difficult.

人間 の 知能 を コンピュータ で 実現 する こと の 奥深 さ が わかった の が 、 第 1 次 AI ブーム であった 。 にんげん||ちのう||こんぴゅーた||じつげん||||おくふか||||||だい|つぎ|ai|ぶーむ| The first AI boom showed the depth of the challenge of realizing human intelligence with computers.

(* 注 16) コンピュータ 将棋 や 囲碁 に 関して は 、 はこ だて 未来 大学 教授 、 現 人工 知能 学会 会長 の 松原 仁 氏 が 第一人者 である 。 そそ|こんぴゅーた|しょうぎ||いご||かんして||||みらい|だいがく|きょうじゅ|げん|じんこう|ちのう|がっかい|かいちょう||まつばら|しとし|うじ||だいいちにんしゃ| (* Note 16) Regarding computer shogi and Go, Mr. Hitoshi Matsubara, a professor at Future University Hakodate and the current chairman of the Japanese Society for Artificial Intelligence, is the first person.