人工 知能 は 人間 を 超える か Chapter04(3)
日本 の この 分野 の 研究 に 多大な 影響 を 与えて いる 研究者 だ 。 自然 言語 処理 だけ で なく 、 データベース や プログラミング の 話 も 多くて 楽しかった のだ が 、 機械 学習 の 長い 解説 が 終わった 後 、 黒 橋 先生 は 「 ま 、 手法 は いろいろ ある ん です が 、 結局 、 いい 特徴 量 を つくる の が 実は 一 番 大変で 、 人間 が やる しか ない ん です けど ね 」 と さらっと 言った 。
その 言葉 に 、私 は 頭 を 殴られた ような ショック を 受けた 。
私 が ずっと 考えて きた こと を あっさり 言われた から だ 。 特徴 量 を どう つくる か が 機械 学習 に おける 本質的な 問題 である と いう こと を 、自分 以外 の 人 の 口 から 初めて 聞いた 。 その後 、その 問題 は 、特徴量 設計 として 普通に 理解 される ように なった 。
人間 は 特徴 量 を つかむ こと に 長けている 。
何 か 同じ 対象 を 見ている と 、自然に そこに 内在する 特徴 に 気づき 、より 簡単に 理解する こと が できる 。 ある 道 の 先人 が 、驚く ほど シンプルに ものごと を 語る の を 聞いた こと が ある かも しれない 。 特徴 を つかみ さえ すれば 、複雑に 見える 事象 も 整理 され 、簡単に 理解 する こと が できる 。
同じ こと を 人間 は 視覚 情報 でも やって いる 。
たとえば 、ある 動物 が ゾウ か キリン か シマウマ か ネコ か を 見分ける の は 人間 に は とても 簡単だ が 、画像 情報 から これら の 動物 を 判定する のに 必要な 特徴 を 見つけ出す のは 、コンピュータ に は きわめて 難しかった 。 機械 学習 を させよう に も 、この 特徴 を 適切に 出す こと が でき なければ 、うまく 学習 でき ない のである 。
第 3 章 で は 、「知識 」を 入れれば 人工 知能 は 賢く なる が 、どこまで 「知識 」を 書いて も 書き切れない と いう 問題 に ぶつかった 。
また 、「フレーム 問題 」で は 、タスク に よって ロボット が 使う べき 知識 を どう 定めて おけば よい の か が 決められ なかった 。 「シンボルグラウンディング 問題 」で は 、コンピュータ に とって 、シマウマ が 「シマシマ の ある ウマ 」だ と 理解 でき ない こと が 問題 であった 。
一方 、この 章 で 述べた の は 、機械 学習 で は 、何 を 特徴量 と する か は 人間 が 決め ない と いけなかった と いう こと である 。
人間 が うまく 特徴 量 を 設計 すれば 機械 学習 は うまく 動き 、そう で なければ うまく 動か ない 。
これ ら の 問題 は 、結局 、同じ ひとつ の こと を 指して いる 。
いままで 人工知能 が 実現 しなかった の は 、「世界 から どの 特徴 に 注目 して 情報 を 取り出す べき か 」に関して 、人間 の 手 を 借り なければ ならなかった から だ 。
つまり 、コンピュータ が 与えられた データ から 注目 すべき 特徴 を 見つけ 、その 特徴 の 程度 を 表す 「特徴量 」を 得る こと が できれば 、機械 学習 における 「特徴量設計 」の 問題 は クリア できる 。
シンボルグラウンディング 問題 でも 、コンピュータ が 自ら 特徴 を 見つけ出し 、さらに 特徴 を 用いて 表される 概念 (たとえば 「シマシマ の ある ウマ 」)を 取り出す こと が できれば 、あとは 記号 の 名前 (シマウマ )を 与えて 人間 が 結びつける ことで 、コンピュータ は 記号 の 意味 を 理解して 使う こと が できる (お母さん が 子ども に もの の 名前 を 教える ように )。
フレーム 問題 でも 、データ を もと に 現象 の 特徴 を 取り出し 、その 特徴 を 用いた 概念 を 使って 知識 を 表現しておけば 、そうそう 例外的 な こと は 起こらない はずである (*注 34 )。
また 「必要な 知識 を 選び出す のに 無限に 考えて しまう 」なんて こと も ない 。
かつて 、言語 哲学者 の ソシュール は 、記号 と は 、概念 (シニフィエ )と 名前 (シニフィアン )が 表裏一体 と なって 結びついた もの と 考えた 。
シニフィエ は 記号 内容 、シニフィアン は 記号 表現 と も いわ れる 。 図 19 に 示す ように 、シニフィアン である ところの 「ネコ 」という 言葉 は 別に 任意の もの で よい が 、いったん 結びついて しまう と 、ネコ という 名前 (シニフィアン )は 、ネコ の 概念 (シニフィエ )を 表す ように 了解され 、運用される ように なる 。
コンピュータ が データ から 特徴 量 を 取り出し 、 それ を 使った 「 概念 ( シニフィエ : 意味 される もの )」 を 獲得 した 後 に 、 そこ に 「 名前 ( シニフィアン : 意味 する もの )」 を 与えれば 、 シンボルグラウンディング 問題 は そもそも 発生 しない 。
そして 、「決められた 状況 で の 知識 」を 使う だけ で は なく 、状況 に 合わせ 、目的 に 合わせて 、適切な 記号 を コンピュータ 自ら が つくり出し 、それ を 使った 知識 を 自ら 獲得し 、活用する こと が できる 。 これ まで 人工 知能 が さまざまな 問題 に 直面 して いた の は 、概念 (シニフィエ )を 自ら 獲得 する こと が できなかった から だ 。 コンピュータ が シニフィエ を 獲得 する 端緒 が 開かれ つつ ある 。 次の 章 で は 、人工 知能 の 50 年 来 の ブレークスルー である 「ディープラーニング 」に ついて 説明 し たい 。 実際 に は その 数 年 前 から 活動 が 行われていた 。
(* 注 29) もう ひと つ 「 強化 学習 」 を 加えて 3 つ と 説明 される こと も ある 。
強化 学習 と は 、試行 錯誤 を 通じて 環境 に 適応 する 学習 制御 の 枠組み である 。 教師 あり 学習 と 異なり 、正しい 行動 を 明示的に 与えられる ので は なく 、報酬 という 行動 の 望ましさ を 表す 情報 を 手がかり に 学習する 。 報酬 に は 遅れ が ある ため 、行動 を 実行 した 直後 の 報酬 を 見る だけ で は 、学習 主体 は その 行動 が 正しかった か どうか を 判断 できない と いう 困難 を 伴う 。
(*注 30) Reuter -21578
(* 注 31) 手法 に よって は それ 以外 の 方法 も ある 。
(*注 32)ID3、C4・5、C5・0と呼ばれるアルゴリズムが知られている。
(* 注 33) フィーチャーエンジニアリング の 日本語 訳 は 固まって おら ず 、 素性 工学 、 特徴 量 工学 、 素性 設計 など と も 呼ば れる が 、 ここ で は 本書 の 用語 に あわせ 、 特徴 量 設計 と 訳す 。
(* 注 34) そもそも 、 人間 も 本質 的に は フレーム 問題 を 解いて いない 。
ただ 、実質的に 多くの 場合に 問題 ない ような 処理を している だけであり 、それは 特徴 表現 学習 (と その 先に ある 技術 )を 使えば 、コンピュータに も 可能である はずだ 。