×

Utilizziamo i cookies per contribuire a migliorare LingQ. Visitando il sito, acconsenti alla nostra politica dei cookie.

人工知能は人間を超えるか (Will AI surpass human?), 人工知能は人間を超えるか Chapter… – Text to read

人工知能は人間を超えるか (Will AI surpass human?), 人工知能は人間を超えるか Chapter 05 (3)

Avanzato 2 di giapponese lesson to practice reading

Inizia a seguire questa lezione ora

人工 知能 は 人間 を 超える か Chapter05(3)

何て こと は ない 、とても 単純 で 素朴な アイデア だ 。

実際 、ディープラーニング の アイデア に かなり 近い もの は 昔 から あって 、早くも 1980年代には、当時NHKの研究所に勤めていた福島邦彦氏(後に大阪大学教授)がネオコグニトロンという先行的な研究をしている。

1990年代 に は 産業 技術 総合 研究所 の 野田 五十樹 氏 や 、ドワンゴ 人工 知能 研究所 所長 の 山川 宏 氏 も 同じ ような こと を 考えて いた 。

私 も 2000 年 ごろ から 「どう 考えて も この やり方 しか ない はずだ 」と 思って 、ずっと どう やれば できる の か を あれこれ 試みて きた 。

先 述 の ジェフ ・ホーキンス 氏 は 、シリコンバレー に 自分 で レッドウッド 神経 科学 研究所 と いう 施設 まで つくった (現在 は カリフォルニア 大学 バークレー 校 の 下 に ある )。

だが 、「どう 考えて も この やり方 しか ない 」はず なのに 、どうしても うまく いか なかった 。

それ が 、2006 年 に トロント 大学 の ヒントン 氏 が 研究 論文 で 実証 して 見せ (その 前後 に 同じ ような 考え方 で 結果 が 出ている 研究 も たくさん ある し 、実は 、教師なし データ を 使って 教師あり 学習 の 精度 を 上げる という アイデア 自体 は 、かなり 古くから ある )、2012 年 に は 、コンペティション で 圧勝 する こと に よって 、ついに 多くの 人 の 目 に 触れる 形 で 、その すごさ が 伝わった 。

その後 の 投資 合戦 、期待感 の 高まり は 前述 の 通り である 。

いまに なって わかる の は 、考え方 は 間違って いなかった 。

ただ 、やり方 が 違った の だ 。

実は 、こうした 特徴 量 や 概念 を 取り出す という こと は 、非常に 長 時間 の 「精錬 」の 過程 を 必要 と する 。

何度 も 熱して は たたき上げ 、強く する ような プロセス が 必要である 。

それ が 、得られる 特徴量 や 概念 の 頑健性 (ロバスト性 とも 呼ぶ )に つながる 。 その ため に どういう こと を やる か というと 、一見 する と 逆説的 だが 、入力 信号 に 「ノイズ 」を 加える のだ 。

ノイズ を 加えて も 加えて も 出て くる 「概念 」は 、ちょっと や そっと の こと で は ぐらつかない 。

その 結果 、たまたま 一致 して いる だけ で 、「2 つ の 県 の 天気 が 似て いる 」と 認識 されて しまう のだ 。 そこ で 、ノイズ を 加える 。

ある 地点 の 天気 を ちょっと ズラす のである 。

晴れ は くもり に 、くもり は 晴れ か 雨 に 、雨 は くもり に 。

サイコロ を 振って 、偶数 の 目 が 出れば 天気 を ズラす 、と しても よい 。

その 結果 、「ちょっと 違う 」天気 の データ が できる 。

この 天気 の データ も 、もと の 天気 の データ と 同じ ような データ として 扱う のである 。

もともと 100 日間 の 天気 の データ が あった と して 、ノイズ を 加える と 、さらに 100 枚 の 天気 の データ が できる 。

ノイズ の 加え方 は ランダム だ から 、2 回 やる と 2 回 とも 違う 天気 の データ が できる 。

だから 、10 回 、100回と繰り返してもよい。

100 回 繰り返す と 、もと の 100 枚 の 天気 の データ が 1万 枚 の 天気 の データ に 置き換えられる 。 この 1万 枚 の 天気 の データ は 言って みれば 、「ちょっと 違った かも しれない 過去 」である 。

ある 地点 の 天気 が 、実は 、別の 世界 で は 晴れ で はなく くもり だった かも しれない 。

何 か ちょっと した 影響 で 、ある 地点 で 雨 で 運動会 が 中止 に なった の が 、くもり で ギリギリ 開催 できた かも しれない 。

こうした 「ちょっと 違った かも しれない 過去 」の データ を たくさん つくる こと で 、データ の 数 を 無理やり 増やす のだ 。

そう する と 、何 が 起こる の か 。

「ある 地点 と 別の 地点 の 天気 が たまたま 一致 して いた 」という こと が なくなる 。

ちょっと 違った かも しれ ない 過去 を 含めて 計算 する ので 、「たまたま 一致 」と いう こと は ない 。

一致 する なら 一致 する なり の 理由 が ある はずである 。

ディープラーニング で は 、このように 「ちょっと 違った かも しれない 過去 」の データ を たくさん つくり 、それ を 使って 学習する こと で 、「絶対に 間違い で は ない 」特徴量 を 見つけ出す 。

そして 、「絶対 に 間違い で は ない 」特徴量 である が ゆえに 、その 特徴量 を 使った 高次 の 特徴量 も 見つける こと が できる のである 。

このような 「ちょっと 違った 過去 」を 使えば いい と いう こと が 、私 も わかって いなかった し 、ほか の 研究者 も わかって いなかった 。

1個 1個の 抽象化 の 作業 が 非常に 堅牢 である こと に よって 、2段目 、3段目 と 積み上がった とき にも 効果 を 発揮する 。

家 を 建てる とき に 、1 階 部分 が グラグラ していれば 、2 階 、3 階 を 重ねていく のは 無理 が ある 。

2階建て 、3階建て の 家 を つくる に は 、結局 、1階 部分 を きわめて 頑健 に つくる 必要 が あった のだ 。

そして 、ちょっと や そっと の こと で は 揺るがない 頑健性 を 獲得する に は 、実は 、ものすごい 計算機 パワー が 必要だ 。

たとえば 、手書き 文字 の 認識 の 28 ピクセル × 28 ピクセル の 画像 は 、画像 データ として は 非常に 小さな サイズ だが 、1 枚 の 画像 に つき 数百 から 数千 の ノイズ を 加えた だけ で 、普通の パソコン で 計算 する のに 2 日 くらい かかる 。

もっと 解像度 の 高い 画像 で トレーニング しよう と 思う と 、2015 年 現在 の マシンスペック でも 、GPU(画像処理ユニット)が入ったサーバーを数台以上つなげてようやく精度が上がるレベルである。

グーグル の ネコ 認識 の 研究 で は 、前述 の ように 、1000 台 の サーバー を 使って おり 、これ は 金額 に して 100万 ドル (1億 円 )分 である (* 注 44 )。

10 年 以上 前 の マシン で は 望む べくも なかった が 、マシン パワー が 飛躍的に 高まった 現在 に なって 、ようやく 頑健性 を 高める こと 、それに よって ニューラルネットワーク を 多段 にして 、高次 の 特徴量 を 得る こと が 可能に なってきた のである 。

たとえば 、ドロップ アウト と いって 、ニューラルネットワーク の ニューロン を 一部 停止 させる 。

隠れ 層 の 50% の ニューロン を ランダム に 欠落 させる のだ 。

言って みれば 、「あなた が つくった 特徴 表現 の 中 で 、今回 は 、全国 、日本海側 、関東 、四国 、沖縄 の データ は 使えません 。 さあ 、47 都道府県 の 天気 を 予想 して ください 」と いう 問題 を 解く のである 。

その 結果 、何 が 起こる か 。

東北 地方 の 天気 に は 「東北 」の 項目 を 使えば いい と 思っていた のだが 、東北 の データ が 使えない こと が ある わけだ 。

そう する と 、東北 の データ が 使えない とき に も 、東北 地方 の 天気 が ある 程度 予想できる ように 、ほか の 項目 を 工夫する 必要 が ある 。

太平洋 側 、日本海 側 と いう 項目 が あれば 少し 安心だ 。

あるいは 、日本海側 という 項目 が 使えない とき の ために 、東北 とか 北陸 という 分け方 で 持っておく こと も 重要だ 。

このように 、ある 特徴量 が ほか の 特徴量 を カバー する ように 、最適化 されて いく 。 ある 特徴 量 に 過度に 依存 した 特徴 表現 が なくなる 。

そもそも 、ある 特徴 量 だけ に 依存 し すぎる の は 危険 だ 。

つまり 、一部分 の 特徴量 を 使えなく する こと が 、適切な 特徴 表現 を 見つける こと に 有効に 働く のである 。

ほか に も 、ニューラルネットワーク に とって 、「過酷な 環境 」が いろいろ と 研究 されている 。 そこ まで いじめ 抜か ない と 、データ の 背後 に 存在 する 「本質的な 特徴量 」を 獲得 でき ない のである 。

画像 認識 の 精度 が 上がら なかった の は 、頑健性 を 高める ため に いじめ抜く という 作業 の 重要性 (専門的に 言う と 、正則化 の ため の 新しい 方法 )に 気づいて いなかった ため 、そして 、そもそも マシン パワー が 不足して できなかった ため である 。

科学 的な 発見 は いつも そう だが 、発見されてしまえば 、何という こと は ない 、単純 で 自明 な こと だったり する 。 実際 、多く の 研究者 が 考えていた 「自己 符号化器 を ベース に 特徴量 を 多段 に していけば よい 」と いう 予想 は 正しかった のである 。

ところが 、それ が 人工 知能 の 分野 で 長年 実現 できなかった のは 、コンピュータ が 概念 を 獲得 しない まま 、記号 を 単なる 記号 表記 として のみ 扱っていた から だ 。

記号 を 「概念 と 記号 表記 が セット に した もの 」として 扱って こなかった 、あるいは 扱う こと が できなかった から である 。

その ため に 、現実 世界 の 中 から 「何 を 特徴 表現 と する か 」は 、すべて 人間 が 決めて きた 。

決める しか なかった 。

コンピュータ の 能力 が いま ほど 高く なく 、記号 を それ の もと に なる 低次 の 情報 と あわせて 扱う こと など でき なかった から だ 。

そこ が すべて の 問題 の 根源 に なって いた 。

ディープラーニング の 登場 は 、少なくとも 画像 や 音声 という 分野 に おいて 、「データ を もとに 何 を 特徴 表現 すべき か 」を コンピュータ が 自動的に 獲得 する こと が できる と いう 可能性 を 示している 。

簡単な 特徴 量 を コンピュータ が 自ら 見つけ出し 、それ を もと に 高次 の 特徴 量 を 見つけ出す 。

その 特徴 量 を 使って 表さ れる 概念 を 獲得 し 、その 概念 を 使って 知識 を 記述 する という 、人工 知能 の 最大 の 難関 に 、ひと つ の 道 が 示さ れた のだ 。

もちろん 、対象 は 画像 や 音声 だけ で は ない し 、これ だけ で すべて の 状況 に おける 「特徴 表現 の 問題 」が 解決 された と は とても 思えない 。

しかし 、きわめて 重要な ひとつ の ブレークスルー を 与えている のは 間違いない 。

「人間 の 知能 が プログラム で 実現 でき ない はず が ない 」と 思って 、人工 知能 の 研究 は およそ 60 年 前 に スタート した 。

いま まで それ が 実現 でき なかった の は 、特徴 表現 の 獲得 が 大きな 壁 と なって 立ちふさがって いた から だ 。

ところが 、そこ に ひと筋 の 光明 が 差し始めている 。

暗い 洞窟 の 先 に 、いままで 見え なかった 光 が 届き 始めた 。

でき なかった こと に は 理由 が あり 、 それ が 解消 さ れ かけて いる のだ と したら 、 科学 的 立場 と して は 、 基本 テーゼ に 立ち返り 、「 人間 の 知能 が プログラム で 実現 できない はず は ない 」 と いう 立場 を とる べきで は ない だろう か 。

いったん 人工 知能 の アルゴリズム が 実現 すれば 、人間 の 知能 を 大きく 凌駕 する 人工知能 が 登場 する のは 想像 に 難く ない 。

少なくとも 、私 の 定義 で は 、特徴量 を 学習する 能力 と 、特徴量 を 使った モデル 獲得 の 能力 が 、人間 より も きわめて 高い コンピュータ は 実現可能であり 、与えられた 予測 問題 を 人間 より も より 正確に 解く こと が できる はずである 。 それ は 人間 から 見て も 、きわめて 知的に 映る はずだ 。

人間 の 脳 は 、さまざまな 点 で 物理的な 制約 が ある 。

たとえば 普通の 人 より 脳 の サイズ が 10 倍 大きな 人 は 存在 し ない 。

しかし コンピュータ の 場合 に は 、コンピュータ 1 台 で できる こと は 、10 台 に すれば 10 倍 に 、100台にすれば100倍になる。

人間 の 知能 レベル に なる という こと は 、すなわち 人間 の 知能 を 超える という こと と 同じ である 。

特徴 表現 の 獲得 能力 が 、言語 概念 の 理解 や ロボット など の 技術 と 組み合わせられる こと で 、可能性 としては 、すべての ホワイトカラー の 労働 を 代替 し うる 技術 と なる 。

Learn languages from TV shows, movies, news, articles and more! Try LingQ for FREE