人工知能は人間を超えるか (Will AI surpass human?), 人工知能は人間を超えるか Chapter 02 (2)

人工知能は人間を超えるか Chapter 02 (2)

ただ、迷路やパズルの探索と違うのは、相手がいることである。

こちらが指した手に対して、相手が手を返して、さらにこちらが手を指して …… ということを繰り返して、探索木をつくらないといけない。

また、組み合わせの数がとても多く、すぐに天文学的な数字になってしまうので、なかなか最後まで探索しきれない。

どれくらいの組み合わせがあるかというと、８×８の盤面で駒が白黒、裏返しありのオセロはおよそ 10 の 60 乗通り（つまり、60 桁の数字。

つまり、場合の数からいうと、オセロが一番簡単で、その次にチェス、将棋、囲碁の順番に難しくなる。

観測可能な宇宙全体の水素原子の数がおよそ 10 の 80 乗個といわれており、この数字がこの世界で「数えられるもの」の数としては最大だろうから、盤面で起こりうる組み合わせがいかに膨大な数字か、おわかりいただけるのではないだろうか。これだけ組み合わせの数が膨大だと、最後までしらみつぶしに調べることはとうていできない。

そこで、盤面を評価するスコアをつくり、そのスコアがよくなるように、次の指し手を探索することになる。

それが現在まで続くゲーム攻略のための人工知能の基本的な設計となっている。

ゲームは、自分は自分の点数を最大化（Ｍａｘ）する手を指し、相手はこちらの点数を最小化（Ｍｉｎ）する手を指すことで成り立つと仮定すると、５手先、10 手先の最善手が決まる。

これがミニマックス法で、２手先の盤面評価から次の自分の指し手を決める方法を次ページの図８で紹介している。

ついに人類がコンピュータに敗れたということで、世界中に衝撃が広がった。

持ち駒が使える将棋でコンピュータが人間に勝つのは当分先と思われていたが、２０１２年、第１回将棋電王戦で、当時の日本将棋連盟会長・米長邦雄永世棋聖が前年の世界コンピュータ将棋選手権の優勝ソフト「ボンクラーズ」と対戦して敗れた。その著書『われ敗れたり』には、コンピュータに敗れるまでの経緯と心境が綴られている（＊注 17）。翌２０１３年には、現役プロ棋士 vs コンピュータソフトによる５対５の「第２回将棋電王戦」が行われ、第２局でコンピュータソフト「 ponanza 」が佐藤慎一四段に勝利、史上初めて現役プロ棋士が敗れて話題となった。

対戦成績はソフト側の３勝１敗１分け、翌２０１４年の「第３回将棋電王戦」もソフト側の４勝１敗で、コンピュータ有利の状況が続く。

将棋電王戦はニコニコ生放送で中継され、「人間 vs コンピュータソフト」というわかりやすさも手伝って、屈指の人気コンテンツとなった。

なぜ強くなってきたかというと、ひとつは、コンピュータの処理能力が飛躍的に向上したこと。

たとえば、第２回電王戦に登場した「ＧＰＳ将棋」は東京大学にある６７０台のコンピュータと接続し、１秒間に３億手読むといわれていた。将棋の場合、序盤の組み合わせはそれこそ無数にあるため、どれだけ処理能力の高いコンピュータでも、すべての手を読むことはできない。

ところが、中盤になり、駒の位置が定まってくるにつれて、有効打の数は限られてくる。だから、コンピュータは後になればなるほど本領を発揮する。

特に詰めに至る最終局面ではまずミスしないので、中盤をいかに戦うかが、将棋ソフトとの対戦では重要になるのだ。

ほかにもいくつか強くなった秘訣はあるのだが、ここでは２つだけご紹介しよう。機械学習によって、盤面と指すべき手を過去の膨大な棋譜から学習することができるようになった。

そして、そこに新しい特徴量を使えばいいことがわかってきたのだ。

特徴量というのは「データの中のどこに注目するか」ということであって、それによって、プログラムの挙動が変化する。

たとえば、「王手をされているか」というのは１つの特徴量だし、「王将がどのくらい前に出ているか」というのも１つの特徴量である。以前は、機械学習で使う特徴量は、あくまで「２つの駒の関係」が中心だった。

王将に対して飛車がこの位置にあるとか、金が王手をかけているとか、２つの駒の位置関係に注目して、指すべき手を計算していた。

ところが、研究が進むにつれて、徐々に「３つの駒の関係」を使ったほうが有効だということがわかってきた。

たとえば、王将と金と銀の位置関係がどうなれば有利なのか、人間には見えていなかった相関関係を、過去の棋譜というビッグデータの中から見つけ出し、それによって次の指し手を絞るときの精度が向上したのだ。

それまでは、それぞれの駒の数や位置関係に点数をつけて盤面を評価していたのだが、その点数のつけ方が妙味であって、極端な話、ある局面をどういうふうに評価するかによって、ソフトの強さが決まっていた。

点数のつけ方は、あくまでも人間が決めていたのだ。

ところが、モンテカルロ法では１８０度発想を変えて、ある局面まできたら、駒の数や位置関係によって点数をつけることを放棄する。

では、目の前の盤面をどうやって評価するかというと、そこから交互に、完全にランダムに手を指し続け、とにかく終局させるのだ（これを「プレイアウト」という）。

次に指せる手が 10 手あるとしたら、10 分の１の確率でどれかを指す。

相手も次に指せる手が 10 手あるとしたら、また 10 分の１の確率でどれかを指す。

それを交互に繰り返していけば、いずれ勝負がつく。

最初の試行では自分が勝ったけれども、次は相手の勝利、その次は自分 …… ということを、たとえば１００回繰り返す。

その結果、60 勝 40 敗ならスコアは 60 点、20 勝 80 敗ならスコアは 20 点、といった具合に評価するのだ。

１秒間に数億手を読むコンピュータなら、ある局面からランダムに指してどちらが勝つかをシミュレーションすることなど、実にたやすい。

そうやっていちいち手の意味を考えず、ひたすらランダムに指し続け、その勝率で盤面を評価したほうが、人間がスコアのつけ方を考え、重みづけをして盤面を評価するよりも、最終的に強くなることがわかってきた（実際には完全なランダムではなく、いろいろな工夫をしている）。

素人の判断（ランダム）でも、ケタ違いに多くなれば、玄人の判断（人間による重みづけ）にも勝るということだ。

これらの新しい手法や発見によって、ゲームを攻略するプログラムはどんどん高度になり、時に、人間の能力を超えるほどになってきた。ただし、その基本原理は探索であって、それは何十年も昔から変わっていない。こうした探索の方法は、人間の思考方法と違って、ブルートフォース（力任せ）ともいわれる。

探索すべき解の空間が広がると、この力任せの場合分けは通用しにくくなる。

囲碁は、将棋よりもさらに盤面の組み合わせが膨大になるので、人工知能が人間に追いつくにはまだしばらく時間がかかりそうだ。

人間の思考方法をコンピュータで実現し、人間のプロに勝つには、第５章で出てくるような特徴表現学習の新しい技術が何らかの形で必要だろう。

さぞかしコンピュータは賢いのだろうと思われたが、冷静になって考えてみると、この時代の人工知能は、非常に限定された状況でしか問題が解けなかった。

迷路を解くのも、パズルを解くのも、チェスや将棋に挑戦するのも、明確に定義されたルールの中で次の一手を考えればよかったのだが、現実の問題はもっとずっと複雑だった。

たとえば、ある人が病気になったときに、どんな治療法があるのか。

あるいは、ある会社がこれから伸びていくにはどういう製品を開発したらいいかといった、私たちが普段直面するような本当に解きたい問題は全然解けない。いわゆるトイ・プロブレム（おもちゃの問題）しか解けないということが次第に明らかになってきた。

そして、１９７０年代の冬の時代を迎えてしまう。

難解な定理を証明するとか、チェスで勝利するといった高度に専門的な内容は、コンピュータにとっては意外に簡単だった。

しかし、現実の問題は難しかった。

人間の知能をコンピュータで実現することの奥深さがわかったのが、第１次ＡＩブームであった。

（＊注 16）コンピュータ将棋や囲碁に関しては、はこだて未来大学教授、現人工知能学会会長の松原仁氏が第一人者である。

Try LingQ and learn from Netflix shows, Youtube videos, news articles and more.

人工知能は人間を超えるか Chapter 02 (2) じんこう|ちのう||にんげん||こえる||chapter Will Artificial Intelligence Surpass Humans Chapter 02 (2) L'intelligence artificielle dépassera-t-elle l'homme ? Chapitre 02 (2) A inteligência artificial ultrapassará o ser humano Capítulo 02 (2)

ただ、迷路やパズルの探索と違うのは、相手がいることである。 |めいろ||ぱずる||たんさく||ちがう|||あいて|||| However, what is different from exploring mazes and puzzles is that there is an opponent.

こちらが指した手に対して、相手が手を返して、さらにこちらが手を指して …… ということを繰り返して、探索木をつくらないといけない。 ||さした|て||たいして|あいて||て||かえして||||て||さして|||||くりかえして|たんさく|き||||| For the hand that we pointed to, the other person returned the hand, and then this pointed to the hand, and so on, and so on, and so on, and the search tree had to be struck.

また、組み合わせの数がとても多く、すぐに天文学的な数字になってしまうので、なかなか最後まで探索しきれない。 |くみあわせ||すう|||おおく||てんもん|まな|てきな|すうじ||||||さいご||たんさく||| Also, the number of combinations is so large that it quickly becomes an astronomical number, so it is difficult to search to the end.

どれくらいの組み合わせがあるかというと、８×８の盤面で駒が白黒、裏返しありのオセロはおよそ 10 の 60 乗通り（つまり、60 桁の数字。 |||くみあわせ||||||||ばんめん||こま||しろくろ|うらがえし|||||||じょう|とおり||けた||すうじ The number of combinations is that on an 8x8 board, the pieces are black and white, and the Othello with the inside out is about 10 to the 60th power (that is, a 60-digit number).

一、十、百 …… と数えていって、那由他という単位に当たる）、８×８の盤面で駒が白黒６種類ずつのチェスはおよそ 10 の１２０乗通り（もはや大きすぎて単位がない）、９×９の盤面で駒が８種類ずつ、「成り」やとった駒を使える将棋はおよそ 10 の２２０乗通り、19×19 の盤面で駒が白黒の囲碁はおよそ 10 の３６０乗通りである。ひと|じゅう|ひゃく||かぞえて||なゆ|た|||たんい||あたる||ばんめん||こま||しろくろ|しゅるい|||||||じょう|とおり||おおき||たんい||||ばんめん||こま||しゅるい||なり||こま||つかえる|しょうぎ||||じょう|とおり||ばんめん||こま||しろくろ||いご||||じょう|とおり| Counting one, ten, one hundred, etc., it corresponds to a unit called Decillion, etc.), chess with 6 types of black and white pieces on an 8x8 board is about 10 to the 120th power (it is no longer too big and the unit is No), 8 types of pieces on a 9x9 board, 8 types of pieces can be used, and the number of shogi that can be used is about 10 to the 220th power. It's a street.

つまり、場合の数からいうと、オセロが一番簡単で、その次にチェス、将棋、囲碁の順番に難しくなる。 |ばあい||すう||||||ひと|ばん|かんたんで||つぎに||しょうぎ|いご||じゅんばん||むずかしく| In other words, in terms of the number of cases, Othello is the easiest, followed by chess, shogi, and go.

観測可能な宇宙全体の水素原子の数がおよそ 10 の 80 乗個といわれており、この数字がこの世界で「数えられるもの」の数としては最大だろうから、盤面で起こりうる組み合わせがいかに膨大な数字か、おわかりいただけるのではないだろうか。かんそく|かのうな|うちゅう|ぜんたい||すいそ|げんし||すう||||じょう|こ||いわれて|||すうじ|||せかい||かぞえられる|||すう||||さいだい|||ばんめん||おこり||くみあわせ|||ぼうだいな|すうじ||||||||| Since the number of hydrogen atoms in the entire observable universe is said to be approximately 10 to the 80th power, which is probably the largest number of "countable things" in the world, you can understand the enormous number of possible combinations that could occur on the board. これだけ組み合わせの数が膨大だと、最後までしらみつぶしに調べることはとうていできない。 ||くみあわせ||すう||ぼうだいだ||さいご||||しらべる||||| With such a huge number of combinations, it is almost impossible to scrutinize to the end.

そこで、盤面を評価するスコアをつくり、そのスコアがよくなるように、次の指し手を探索することになる。 ||ばんめん||ひょうか||すこあ||||すこあ|||||つぎの|さして||たんさく|||| We then evaluate the board, form a score, and search for the next move that will improve the score.

それが現在まで続くゲーム攻略のための人工知能の基本的な設計となっている。 ||げんざい||つづく|げーむ|こうりゃく||||じんこう|ちのう||きほん|てきな|せっけい||| That is the basic design of artificial intelligence for the game strategy that continues to this day.

たとえば将棋の場合、たとえば、自分の「王将」が王手されていればマイナス 10 点、相手の「玉将」に王手をかけていればプラス 10 点、王手はされていなくても自分の「王将」の周囲８マスに相手の「飛車」「角」がいたらマイナス５点、その逆がプラス５点、相手の「歩」が自陣に入り込んできて「と金」に成ったらマイナス１点、その逆がプラス１点 …… のように決めておく。 |しょうぎ||ばあい||じぶん||おうしょう||おうて|されて||まいなす|てん|あいて||たま|すすむ||おうて||||ぷらす|てん|おうて||されて||||じぶん||おうしょう||しゅうい|ます||あいて||ひしゃ|かど|||まいなす|てん||ぎゃく||ぷらす|てん|あいて||ふ||じじん||はいりこんで|||きむ||なったら|まいなす|てん||ぎゃく||ぷらす|てん|||きめて| For example, in the case of shogi, for example, if your "king" is a check, you will get minus 10 points, if you put a check on your opponent's "king", you will get a plus 10 points. If the opponent's "Rook" and "Kaku" are in the 8 squares around the "King", minus 5 points, vice versa, plus 5 points, and if the opponent's "walk" enters your own team and becomes "and money", minus 1 point. , The opposite is plus 1 point ……. その局面、局面でスコアを計算し、仮にいまが３点なら、次の手ではできるだけ３点より大きくなるように指せばよいことになる。 |きょくめん|きょくめん||すこあ||けいさん||かりに|||てん||つぎの|て|||||てん||おおきく|||させば|||| In that phase, the score is calculated in that phase, and if you have 3 points now, you should point to it so that it will be as large as 3 points in the next move.

ゲームは、自分は自分の点数を最大化（Ｍａｘ）する手を指し、相手はこちらの点数を最小化（Ｍｉｎ）する手を指すことで成り立つと仮定すると、５手先、10 手先の最善手が決まる。げーむ||じぶん||じぶん||てんすう||さいだい|か|ｍａｘ||て||さし|あいて||||てんすう||さいしょう|か|ｍｉｎ||て||さす|||なりたつ||かてい|||てさき|てさき||さいぜん|て||きまる Assuming that the game consists of pointing to the hand that maximizes (Max) one's score and the opponent pointing to the hand that minimizes (Min) this score, the best move of 5, 10 and 10 moves. Is decided.

これがミニマックス法で、２手先の盤面評価から次の自分の指し手を決める方法を次ページの図８で紹介している。 |||ほう||てさき||ばんめん|ひょうか||つぎの|じぶん||さして||きめる|ほうほう||つぎ|ぺーじ||ず||しょうかい|| Figure 8 on the next page shows how the minimax method determines the next move based on the board evaluation two moves ahead.

ついに人類がコンピュータに敗れたということで、世界中に衝撃が広がった。 |じんるい||こんぴゅーた||やぶれた|||||せかいじゅう||しょうげき||ひろがった The shock was spread all over the world when human beings were finally defeated by computers.

持ち駒が使える将棋でコンピュータが人間に勝つのは当分先と思われていたが、２０１２年、第１回将棋電王戦で、当時の日本将棋連盟会長・米長邦雄永世棋聖が前年の世界コンピュータ将棋選手権の優勝ソフト「ボンクラーズ」と対戦して敗れた。もち|こま||つかえる|しょうぎ||こんぴゅーた||にんげん||かつ|||とうぶん|さき||おもわれて|||とし|だい|かい|しょうぎ|いなずま|おう|いくさ||とうじ||にっぽん|しょうぎ|れんめい|かいちょう|べい|ちょう|くにお|えいせい|きせい||ぜんねん||せかい|こんぴゅーた|しょうぎ|せんしゅ|けん||ゆうしょう|そふと|||たいせん||やぶれた It was thought that computers could beat humans in shogi that can use their own pieces for the time being, but in 2012, at the 1st Shogi Den-O War, the chairman of the Japan Shogi Association at that time, Kunio Yonenaga, was the previous year. Computer Shogi player was defeated in a match against the winning software "Bonclaws". その著書『われ敗れたり』には、コンピュータに敗れるまでの経緯と心境が綴られている（＊注 17）。 |ちょしょ||やぶれたり|||こんぴゅーた||やぶれる|||けいい||しんきょう||つづられて||そそ In his book, "We are defeated," the process and feelings leading up to the loss to the computer are described (* Note 17). 翌２０１３年には、現役プロ棋士 vs コンピュータソフトによる５対５の「第２回将棋電王戦」が行われ、第２局でコンピュータソフト「 ponanza 」が佐藤慎一四段に勝利、史上初めて現役プロ棋士が敗れて話題となった。よく|とし|||げんえき|ぷろ|きし|||||たい||だい|かい|しょうぎ|いなずま|おう|いくさ||おこなわ||だい|きょく|||||さとう|しんいち|よっ|だん||しょうり|しじょう|はじめて|げんえき|ぷろ|きし||やぶれて|わだい|| The following year, in 2013, a 5 to 5 "2nd Shogi Den-Ohsen" was held by an active professional shogi player vs. computer software, and the computer software "ponanza" won the 4th stage of Shinichi Sato for the first time in history. An active professional shogi player was defeated and became a hot topic.

対戦成績はソフト側の３勝１敗１分け、翌２０１４年の「第３回将棋電王戦」もソフト側の４勝１敗で、コンピュータ有利の状況が続く。たいせん|せいせき||そふと|がわ||か|はい|わけ|よく|とし||だい|かい|しょうぎ|いなずま|おう|いくさ||そふと|がわ||か|はい||こんぴゅーた|ゆうり||じょうきょう||つづく The results of the match were 3 wins, 1 loss and 1 draw on the soft side, and the following 2014 "3rd Shogi Den-O Battle" was also 4 wins and 1 loss on the soft side, and the situation of computer advantage continues.

将棋電王戦はニコニコ生放送で中継され、「人間 vs コンピュータソフト」というわかりやすさも手伝って、屈指の人気コンテンツとなった。しょうぎ|いなずま|おう|いくさ||にこにこ|せい|ほうそう||ちゅうけい|||にんげん|||||||||てつだって|くっし||にんき|こんてんつ|| The Shogi Den-O War was broadcast live on NicoNico, and with the help of the easy-to-understand "human vs. computer software," it became one of the most popular contents.

なぜ強くなってきたかというと、ひとつは、コンピュータの処理能力が飛躍的に向上したこと。 |つよく||||||||||こんぴゅーた||しょり|のうりょく||ひやく|てきに|こうじょう|| One of the reasons why it has become stronger is that the processing power of computers has improved dramatically.

たとえば、第２回電王戦に登場した「ＧＰＳ将棋」は東京大学にある６７０台のコンピュータと接続し、１秒間に３億手読むといわれていた。 |だい|かい|いなずま|おう|いくさ||とうじょう||ｇｐｓ|しょうぎ||とうきょう|だいがく|||だい||こんぴゅーた||せつぞく||びょうかん||おく|て|よむ||いわれて| For example, the "GPS Shogi" that appeared in the 2nd Den-O War was said to be connected to 670 computers at the University of Tokyo and read 300 million hands per second. 将棋の場合、序盤の組み合わせはそれこそ無数にあるため、どれだけ処理能力の高いコンピュータでも、すべての手を読むことはできない。しょうぎ||ばあい|じょばん||くみあわせ||||むすうに|||||しょり|のうりょく||たかい|こんぴゅーた||||て||よむ|||| In the case of shogi, the number of early combinations is so numerous that even the most powerful computer cannot read every hand.

ところが、中盤になり、駒の位置が定まってくるにつれて、有効打の数は限られてくる。 |ちゅうばん|||こま||いち||さだまって||||ゆうこう|だ||すう||かぎられて| However, the number of effective hits becomes limited as the position of the piece is fixed in the middle stage. だから、コンピュータは後になればなるほど本領を発揮する。 |こんぴゅーた||あと||||ほんりょう||はっき| That's why computers do their best at a later date.

特に詰めに至る最終局面ではまずミスしないので、中盤をいかに戦うかが、将棋ソフトとの対戦では重要になるのだ。とくに|つめ||いたる|さいしゅう|きょくめん||||みす||||ちゅうばん|||たたかう|||しょうぎ|そふと|||たいせん|||じゅうように|| Especially in the final phase of the game, we make no mistakes, so how to fight in the middle of the game is important in the game against shogi software.

ほかにもいくつか強くなった秘訣はあるのだが、ここでは２つだけご紹介しよう。 |||いくつか|つよく||ひけつ|||||||||||しょうかい| There are some other secrets that have become stronger, but here are just two. 機械学習によって、盤面と指すべき手を過去の膨大な棋譜から学習することができるようになった。きかい|がくしゅう|||ばんめん||さす||て||かこ||ぼうだいな|きふ||がくしゅう|||||| Machine learning has made it possible to learn the hand that should be referred to as the board from the huge number of game records in the past.

そして、そこに新しい特徴量を使えばいいことがわかってきたのだ。 |||あたらしい|とくちょう|りょう||つかえば|||||| And I realized that I should use a new feature there.

特徴量というのは「データの中のどこに注目するか」ということであって、それによって、プログラムの挙動が変化する。とくちょう|りょう|||||でーた||なか||||ちゅうもく||||||||||ぷろぐらむ||きょどう||へんか| The feature quantity is "where in the data to focus on", and the behavior of the program changes accordingly.

たとえば、「王手をされているか」というのは１つの特徴量だし、「王将がどのくらい前に出ているか」というのも１つの特徴量である。 |おうて||されて|||||||||とくちょう|りょう|||おうしょう||||ぜん||でて|||||||||とくちょう|りょう| For example, "Are you a checker?" Is one feature, and "How long ago the king has come out" is one feature. 以前は、機械学習で使う特徴量は、あくまで「２つの駒の関係」が中心だった。いぜん||きかい|がくしゅう||つかう|とくちょう|りょう|||||こま||かんけい||ちゅうしん| Previously, the features used in machine learning were mainly "relationship between two pieces".

王将に対して飛車がこの位置にあるとか、金が王手をかけているとか、２つの駒の位置関係に注目して、指すべき手を計算していた。おうしょう||たいして|ひしゃ|||いち|||||きむ||おうて||||||||こま||いち|かんけい||ちゅうもく||さす||て||けいさん|| He calculated the hand to point to by paying attention to the positional relationship between the two pieces, such as the rook being in this position with respect to the king, and the money being hung on the check.

ところが、研究が進むにつれて、徐々に「３つの駒の関係」を使ったほうが有効だということがわかってきた。 |けんきゅう||すすむ|||じょじょに|||こま||かんけい||つかった|||ゆうこうだ|||||| However, as the research progressed, it gradually became clear that it was more effective to use the "relationship of three pieces".

たとえば、王将と金と銀の位置関係がどうなれば有利なのか、人間には見えていなかった相関関係を、過去の棋譜というビッグデータの中から見つけ出し、それによって次の指し手を絞るときの精度が向上したのだ。 |おうしょう||きむ||ぎん||いち|かんけい||||ゆうりな|||にんげん|||みえて|||そうかん|かんけい||かこ||きふ|||びっぐ|でーた||なか||みつけだし||||つぎの|さして||しぼる|||せいど||こうじょう|| For example, what is the advantage of the positional relationship between the king, gold, and silver, and the correlation that was not visible to humans, was found in the big data called the past game record, and the next move was made accordingly. The accuracy when squeezing has improved.

それまでは、それぞれの駒の数や位置関係に点数をつけて盤面を評価していたのだが、その点数のつけ方が妙味であって、極端な話、ある局面をどういうふうに評価するかによって、ソフトの強さが決まっていた。 |||||こま||すう||いち|かんけい||てんすう|||ばんめん||ひょうか||||||てんすう|||かた||みょうみ||きょくたんな|はなし||きょくめん|||ひょうか|||||そふと||つよ|||きまって| Until then, the board was evaluated by giving points to the number and positional relationship of each piece, but the way to give the points was interesting, and how to evaluate an extreme story and a certain situation. Therefore, the strength of the software was decided.

点数のつけ方は、あくまでも人間が決めていたのだ。てんすう|||かた|||にんげん||きめて|| The way of scoring was decided by human beings.

ところが、モンテカルロ法では１８０度発想を変えて、ある局面まできたら、駒の数や位置関係によって点数をつけることを放棄する。 |もんてかるろ|ほう|||たび|はっそう||かえて||きょくめん|||こま||すう||いち|かんけい|||てんすう|||||ほうき| However, in the Monte Carlo method, the idea is changed by 180 degrees, and when a certain situation is reached, the score is abandoned according to the number of pieces and the positional relationship.

では、目の前の盤面をどうやって評価するかというと、そこから交互に、完全にランダムに手を指し続け、とにかく終局させるのだ（これを「プレイアウト」という）。 |めのまえ||ばんめん||||ひょうか||||||||こうごに|かんぜんに|らん|だむ||て||さし|つづけ||しゅうきょく|||||||| Then, how to evaluate the board in front of us is to, alternately, keep pointing to the random completely and let it end anyway (this is called "playout").

次に指せる手が 10 手あるとしたら、10 分の１の確率でどれかを指す。つぎに|させる|て||て||||ぶん|||かくりつ|||||さす If there are 10 hands that can be pointed next, point to one with a probability of 1 in 10 minutes.

相手も次に指せる手が 10 手あるとしたら、また 10 分の１の確率でどれかを指す。あいて||つぎに|させる|て||て|||||ぶん|||かくりつ|||||さす If the other party also has 10 moves to point to next, it also points to one with a probability of 1 in 10 minutes.

それを交互に繰り返していけば、いずれ勝負がつく。 ||こうごに|くりかえして|||しょうぶ|| If you repeat it alternately, you will eventually win the game.

最初の試行では自分が勝ったけれども、次は相手の勝利、その次は自分 …… ということを、たとえば１００回繰り返す。さいしょの|しこう|||じぶん||かった||つぎ||あいて||しょうり||つぎ||じぶん||||||かい|くりかえす In the first attempt, you win, but then your opponent wins, then you ... and so on, for example 100 times.

その結果、60 勝 40 敗ならスコアは 60 点、20 勝 80 敗ならスコアは 20 点、といった具合に評価するのだ。 |けっか|か|はい||すこあ||てん|か|はい||すこあ||てん|||ぐあい||ひょうか|| As a result, the score is 60 points for 60 wins and 40 losses, the score is 20 points for 20 wins and 80 losses, and so on.

１秒間に数億手を読むコンピュータなら、ある局面からランダムに指してどちらが勝つかをシミュレーションすることなど、実にたやすい。びょうかん||すう|おく|て||よむ|こんぴゅーた|||きょくめん||らん|だむ||さして|||かつ|||しみゅれーしょん||||じつに| With a computer that reads hundreds of millions of moves per second, it's really easy to point to a random point from a certain point and simulate which one wins.

そうやっていちいち手の意味を考えず、ひたすらランダムに指し続け、その勝率で盤面を評価したほうが、人間がスコアのつけ方を考え、重みづけをして盤面を評価するよりも、最終的に強くなることがわかってきた（実際には完全なランダムではなく、いろいろな工夫をしている）。 |||て||いみ||かんがえ|||らん|だむ||さし|つづけ||しょうりつ||ばんめん||ひょうか||||にんげん||すこあ|||かた||かんがえ|おもみ||||ばんめん||ひょうか||||さいしゅう|てきに|つよく||||||じっさい|||かんぜんな|らん|だむ|||||くふう||| Instead of thinking about the meaning of each hand, it is better to continue pointing to the random and evaluate the board based on the winning percentage, rather than having humans think about how to score and evaluate the board by weighting it. It has been found that it will become stronger (actually, it is not a perfect randomness, but various ideas have been devised).

素人の判断（ランダム）でも、ケタ違いに多くなれば、玄人の判断（人間による重みづけ）にも勝るということだ。しろうと||はんだん|らん|だむ||けたちがいに|おおく||くろうと||はんだん|にんげん|||おもみ||||まさる|||| Even an amateur's judgment (Random) means that if the number of digits increases, the judgment of the expert (weighting by humans) will be better.

これらの新しい手法や発見によって、ゲームを攻略するプログラムはどんどん高度になり、時に、人間の能力を超えるほどになってきた。これら||あたらしい|しゅほう||はっけん|||げーむ||こうりゃく||ぷろぐらむ|||こうどに||ときに|にんげん||のうりょく||こえる|||| With these new techniques and discoveries, the programs that capture the game have become more and more sophisticated, and at times, beyond the capabilities of humans. ただし、その基本原理は探索であって、それは何十年も昔から変わっていない。 ||きほん|げんり||たんさく||||なん|じゅう|とし||むかし||かわって| However, its basic principle is exploration, which has not changed for decades. こうした探索の方法は、人間の思考方法と違って、ブルートフォース（力任せ）ともいわれる。 |たんさく||ほうほう||にんげん||しこう|ほうほう||ちがって||ちからまかせ|||| This method of exploration, unlike the way humans think, is also called brute force.

探索すべき解の空間が広がると、この力任せの場合分けは通用しにくくなる。たんさく|||かい||くうかん||ひろがる|||ちからまかせの|ばあい|わけ||つうよう||| As the space for the solution to be searched expands, it becomes difficult to make a distinction in this brute force case.

囲碁は、将棋よりもさらに盤面の組み合わせが膨大になるので、人工知能が人間に追いつくにはまだしばらく時間がかかりそうだ。いご||しょうぎ||||ばんめん||くみあわせ||ぼうだいに|||じんこう|ちのう||にんげん||おいつく|||||じかん|||そうだ Go has a huge number of board combinations compared to shogi, so it seems that it will take some time for artificial intelligence to catch up with humans.

人間の思考方法をコンピュータで実現し、人間のプロに勝つには、第５章で出てくるような特徴表現学習の新しい技術が何らかの形で必要だろう。にんげん||しこう|ほうほう||こんぴゅーた||じつげん||にんげん||ぷろ||かつ|||だい|しょう||でて|||とくちょう|ひょうげん|がくしゅう||あたらしい|ぎじゅつ||なんらか||かた||ひつようだろう In order to realize the way of thinking of human beings on a computer and to beat the professionals of human beings, some form of new technology of feature expression learning as described in Chapter 5 will be needed.

さぞかしコンピュータは賢いのだろうと思われたが、冷静になって考えてみると、この時代の人工知能は、非常に限定された状況でしか問題が解けなかった。 |こんぴゅーた||かしこい|||おもわ|||れいせいに||かんがえて||||じだい||じんこう|ちのう||ひじょうに|げんてい|||じょうきょう|||もんだい||とけ| It seemed that computers were smart, but when I thought about it calmly, artificial intelligence in this era could only be solved in very limited situations.

迷路を解くのも、パズルを解くのも、チェスや将棋に挑戦するのも、明確に定義されたルールの中で次の一手を考えればよかったのだが、現実の問題はもっとずっと複雑だった。めいろ||とく|||ぱずる||とく|||||しょうぎ||ちょうせん||||めいかくに|ていぎ|||るーる||なか||つぎの|ひと|て||かんがえれば||||げんじつ||もんだい||||ふくざつだった Whether it's solving a maze, solving a puzzle, or challenging chess or shogi, I wish I had considered the next move within well-defined rules, but the real problem is much more complicated. was .

たとえば、ある人が病気になったときに、どんな治療法があるのか。 ||じん||びょうき||||||ちりょう|ほう|||| For example, if a person is ill, what kind of treatment is available?

あるいは、ある会社がこれから伸びていくにはどういう製品を開発したらいいかといった、私たちが普段直面するような本当に解きたい問題は全然解けない。 ||かいしゃ||||のびて|||||せいひん||かいはつ||||||わたくし|||ふだん|ちょくめん|||ほんとうに|ときたい|もんだい||ぜんぜん|とけ| Or, we can't solve the problems we usually face that we really want to solve, such as what kind of products a company should develop in order to grow in the future. いわゆるトイ・プロブレム（おもちゃの問題）しか解けないということが次第に明らかになってきた。 |||||もんだい||とけ||||||しだいに|あきらかに|| It is becoming increasingly clear that only the so-called toy problem (toy problem) can be solved.

同時に、人工知能の大家であるマービン・ミンスキー氏が当時、一世を風靡していたニューラルネットワーク（第４章でくわしく説明する）に関して、特定の条件下における限界を示したこと（＊注 18）（それ自体は大した限界ではなかったのだが、多くの人はそれがニューラルネットワーク自体の限界だと勘違いした）、また、米国政府が機械翻訳は当分成果が出る見込みがないという報告書（ＡＬＰＡＣレポート）を出したことで、研究の支援が打ち切られたことなどが追い打ちとなり、人工知能に対しての失望感が広がった。どうじに|じんこう|ちのう||たいか||||うじ||とうじ|ひと|よ||ふうび||||だい|しょう|||せつめい|||かんして|とくていの|じょうけん|した|||げんかい||しめした||そそ||じたい||たいした|げんかい||||||おおく||じん|||||じたい||げんかい|||かんちがい|||べいこく|せいふ||きかい|ほんやく||とうぶん|せいか||でる|みこみ|||||ほうこく|しょ|ａｌｐａｃ|れぽーと||だした|||けんきゅう||しえん||うちきら|||||おいうち|||じんこう|ちのう||たいして||しつぼう|かん||ひろがった At the same time, artificial intelligence master Marvin Minsky showed the limits under certain conditions regarding neural networks (detailed in Chapter 4), which were predominant at the time (*). Note 18) (Although it wasn't a big limit in itself, many people mistakenly thought it was the limit of the neural network itself), and the U.S. government is unlikely to see any immediate results in machine translation. With the issuance of the report (ALPAC Report), the discontinuation of research support was added to the situation, and disappointment with artificial intelligence spread.

そして、１９７０年代の冬の時代を迎えてしまう。 |とし|だい||ふゆ||じだい||むかえて| Then came the winter of the 1970s.

難解な定理を証明するとか、チェスで勝利するといった高度に専門的な内容は、コンピュータにとっては意外に簡単だった。なんかいな|ていり||しょうめい||||||しょうり||||こうどに|せんもん|てきな|ないよう||こんぴゅーた||||いがいに|かんたんだった Highly technical subjects such as proving a difficult theorem or winning a game of chess were surprisingly easy for the computer.

しかし、現実の問題は難しかった。 |げんじつ||もんだい||むずかしかった However, the reality of the problem was difficult.

人間の知能をコンピュータで実現することの奥深さがわかったのが、第１次ＡＩブームであった。にんげん||ちのう||こんぴゅーた||じつげん||||おくふか||||||だい|つぎ|ａｉ|ぶーむ| The first AI boom showed the depth of the challenge of realizing human intelligence with computers.

（＊注 16）コンピュータ将棋や囲碁に関しては、はこだて未来大学教授、現人工知能学会会長の松原仁氏が第一人者である。そそ|こんぴゅーた|しょうぎ||いご||かんして||||みらい|だいがく|きょうじゅ|げん|じんこう|ちのう|がっかい|かいちょう||まつばら|しとし|うじ||だいいちにんしゃ| (* Note 16) Regarding computer shogi and Go, Mr. Hitoshi Matsubara, a professor at Future University Hakodate and the current chairman of the Japanese Society for Artificial Intelligence, is the first person.

人工知能は人間を超えるか (Will AI surpass human?), 人工知能は人間を超えるか Chapter 02 (2)

人工 知能 は 人間 を 超える か Chapter 02 (2)

Want to learn Japonais? Start now!

人工知能は人間を超えるか Chapter 02 (2)

Want to learn Japonais?
Start now!