人工知能は人間を超えるか Chapter04(3)

日本のこの分野の研究に多大な影響を与えている研究者だ。自然言語処理だけでなく、データベースやプログラミングの話も多くて楽しかったのだが、機械学習の長い解説が終わった後、黒橋先生は「ま、手法はいろいろあるんですが、結局、いい特徴量をつくるのが実は一番大変で、人間がやるしかないんですけどね」とさらっと言った。

その言葉に、私は頭を殴られたようなショックを受けた。

私がずっと考えてきたことをあっさり言われたからだ。特徴量をどうつくるかが機械学習における本質的な問題であるということを、自分以外の人の口から初めて聞いた。その後、その問題は、特徴量設計として普通に理解されるようになった。

人間は特徴量をつかむことに長けている。

何か同じ対象を見ていると、自然にそこに内在する特徴に気づき、より簡単に理解することができる。ある道の先人が、驚くほどシンプルにものごとを語るのを聞いたことがあるかもしれない。特徴をつかみさえすれば、複雑に見える事象も整理され、簡単に理解することができる。

同じことを人間は視覚情報でもやっている。

たとえば、ある動物がゾウかキリンかシマウマかネコかを見分けるのは人間にはとても簡単だが、画像情報からこれらの動物を判定するのに必要な特徴を見つけ出すのは、コンピュータにはきわめて難しかった。機械学習をさせようにも、この特徴を適切に出すことができなければ、うまく学習できないのである。

第３章では、「知識」を入れれば人工知能は賢くなるが、どこまで「知識」を書いても書き切れないという問題にぶつかった。

また、「フレーム問題」では、タスクによってロボットが使うべき知識をどう定めておけばよいのかが決められなかった。「シンボルグラウンディング問題」では、コンピュータにとって、シマウマが「シマシマのあるウマ」だと理解できないことが問題であった。

一方、この章で述べたのは、機械学習では、何を特徴量とするかは人間が決めないといけなかったということである。

人間がうまく特徴量を設計すれば機械学習はうまく動き、そうでなければうまく動かない。

これらの問題は、結局、同じひとつのことを指している。

いままで人工知能が実現しなかったのは、「世界からどの特徴に注目して情報を取り出すべきか」に関して、人間の手を借りなければならなかったからだ。

つまり、コンピュータが与えられたデータから注目すべき特徴を見つけ、その特徴の程度を表す「特徴量」を得ることができれば、機械学習における「特徴量設計」の問題はクリアできる。

シンボルグラウンディング問題でも、コンピュータが自ら特徴を見つけ出し、さらに特徴を用いて表される概念（たとえば「シマシマのあるウマ」）を取り出すことができれば、あとは記号の名前（シマウマ）を与えて人間が結びつけることで、コンピュータは記号の意味を理解して使うことができる（お母さんが子どもにものの名前を教えるように）。

フレーム問題でも、データをもとに現象の特徴を取り出し、その特徴を用いた概念を使って知識を表現しておけば、そうそう例外的なことは起こらないはずである（＊注 34 ）。

また「必要な知識を選び出すのに無限に考えてしまう」なんてこともない。

かつて、言語哲学者のソシュールは、記号とは、概念（シニフィエ）と名前（シニフィアン）が表裏一体となって結びついたものと考えた。

シニフィエは記号内容、シニフィアンは記号表現ともいわれる。図 19 に示すように、シニフィアンであるところの「ネコ」という言葉は別に任意のものでよいが、いったん結びついてしまうと、ネコという名前（シニフィアン）は、ネコの概念（シニフィエ）を表すように了解され、運用されるようになる。

コンピュータがデータから特徴量を取り出し、それを使った「概念（シニフィエ：意味されるもの）」を獲得した後に、そこに「名前（シニフィアン：意味するもの）」を与えれば、シンボルグラウンディング問題はそもそも発生しない。

そして、「決められた状況での知識」を使うだけではなく、状況に合わせ、目的に合わせて、適切な記号をコンピュータ自らがつくり出し、それを使った知識を自ら獲得し、活用することができる。これまで人工知能がさまざまな問題に直面していたのは、概念（シニフィエ）を自ら獲得することができなかったからだ。コンピュータがシニフィエを獲得する端緒が開かれつつある。次の章では、人工知能の 50 年来のブレークスルーである「ディープラーニング」について説明したい。実際にはその数年前から活動が行われていた。

（＊注 29）もうひとつ「強化学習」を加えて３つと説明されることもある。

強化学習とは、試行錯誤を通じて環境に適応する学習制御の枠組みである。教師あり学習と異なり、正しい行動を明示的に与えられるのではなく、報酬という行動の望ましさを表す情報を手がかりに学習する。報酬には遅れがあるため、行動を実行した直後の報酬を見るだけでは、学習主体はその行動が正しかったかどうかを判断できないという困難を伴う。

（＊注 30） Reuter -21578

（＊注 31）手法によってはそれ以外の方法もある。

（＊注 32）ＩＤ３、Ｃ４・５、Ｃ５・０と呼ばれるアルゴリズムが知られている。

（＊注 33）フィーチャーエンジニアリングの日本語訳は固まっておらず、素性工学、特徴量工学、素性設計などとも呼ばれるが、ここでは本書の用語にあわせ、特徴量設計と訳す。

（＊注 34）そもそも、人間も本質的にはフレーム問題を解いていない。

ただ、実質的に多くの場合に問題ないような処理をしているだけであり、それは特徴表現学習（とその先にある技術）を使えば、コンピュータにも可能であるはずだ。

人工知能は人間を超えるか (Will AI surpass human?), 人工知能は人間を超えるか Chapter 04 (3)

人工 知能 は 人間 を 超える か Chapter04(3)

人工知能は人間を超えるか Chapter04(3)