No.010 特集:2020年の通信・インフラ
連載01 人工知能の可能性、必要性、脅威
Series Report

専門家の知恵を再現することの難しさ

機械学習によるパターン認識技術は、過去のブームで目指してきた脳の働きを模倣した「人工知能」とは違うと考える研究者は多い。これまで目指してきた人間に似た知性ではなく、人間とは異質の知性だからだ。しかし、認識、洞察、判断、そして未来を予測するといった、人間が行っている高度な作業を代替し、極めて有用な結果をもたらすことは実証されている。そしてその存在感は、企業のビジネスモデルや労働形態、国の制度などにも大きな影響を及ぼすまでになった。ここからは、人工知能による機械学習の術とその特徴を、なるべく平易に解説していきたい。

例えば、写真に写っているのが、犬か猫かを見分ける方法をコンピュータに教え込む方法を考えてみよう(図2)。まず思いつくのは、あらかじめ決めた基準に沿って分類する方法である。対象とする動物の耳や鼻、眼、骨格などパーツごとの形や質感をチェック項目としてリストアップし、これを見分ける基準にする。こうした手法を、「ルールベース」と呼ぶ。かつての画像や言語などを認識する技術の多くは、犬や猫、言語などのことをよく知る専門家の知見を、数式や文字で表してルール化し、これを基に認識するルールベースの手法を使っていた。

犬と猫を見分けるのは、機械にとっては大仕事の図
[図2] 犬と猫を見分けるのは、機械にとっては大仕事

しかし、こうしたルールベースの画像認識技術は、思いのほか認識エラーを多発してしまう。ルールに合わない例外が、たくさんあり過ぎるからだ。例えば耳に注目すると、同じ犬でも耳の形や色、質感はバラバラ。むしろ猫に似た形の犬さえいる。また、写っている向きやポーズ、状態によっても、見え方がずいぶんと変わってしまう。

言葉を理解するときも同様である。言葉の表面的な定義や文法などに基づいて自然言語を扱おうとしても、その言葉を発した人の意図を知ることはできない。英語の文法は詳しいのに、ちっとも会話できない多くの日本人によく似た状態だ。例え、「2×4」のように数学できっちりと定義されている表記でも、住宅展示場にこの表記があれば、住宅の工法の一種である「ツーバイフォー工法」を指す。屁理屈を言っているようにも感じるかもしれないが、こうした誤認が積み重なり、機械は話し手の意図が分からなくなるのだ。

データの奥に潜む意味など一切無関心

人工知能における機械学習では、犬や猫に共通する特徴や、言語の文法などは一切考えない。この割り切りが、機械学習の重要な点であり、人工知能技術のブレークスルーでもあった。

犬の写真を選び出す方法は以下のようなものだ。まず、大量の写真を集め、犬が写っているものと写っていないものを人間が分類する。そして、次に機械(コンピュータ)が、犬が写っているとされる写真の中で、犬がどのような形で写っているのか、また一緒に写っているモノ、撮影された状況、時刻、場面といった、被写体以外のありとあらゆる周辺環境との相関を統計的に調べる。

そして、教師である人間が選んだ、犬が写っている写真の傾向を割り出し、これを基に写っているのが犬であることを判断する。ひも状のものでつながれている動物は、猫である可能性よりも、犬である可能性が高いといった判断をしているのである。つまり、結果を断定しているのではなく、犬である確率の高いものを選び出しているのだ。

Don't think.Feel.

ここで重要な点は、機械(人工知能)は基本的に、判断の対象となる動物自体の定義は一切考えないことだ。言葉の認識に向けた学習も同様だ。言葉の意味は一切考えず、文字の並びだけを見て、その配列が、どのような状況や時刻、相手の表情、語調、周辺の人、ジェスチャー、そのときの流行などさまざまな付帯状況と一緒に登場したのか傾向を調べて、意図を読み取る。そんな根拠のない方法で正しい判断ができるのかと思う人がいるもしれないが、これが結構正しいのだから納得せざるを得ない。

その場の空気、文脈、時代の気分を、莫大なデータに直接触れることによって、ありのままに感じ取ることが、機械学習の真骨頂である。カンフー映画「燃えよ、ドラゴン」の中で、主演のブルース・リーが発する「Don't think.Feel.(考えるな、感じろ)」という有名な台詞がある。人工知能がやっていることはまさにこれだ。ちなみにIBM社は、こうした特徴をもつ機械学習に基づく技術を、伝統的な「人工知能」と区別するため、「コグニティブ(認知)コンピューティング」と別の言葉で呼んでいる。

恐るべし機械学習

人工知能における機械学習は、従来のコンピュータとも、人間の脳とも質の違う知性を実現する。この異質な知性が、どのような能力を持っているのか。その恐るべき能力の一端を、「集合知」と「暗黙知」という2つのキーワードを挙げて示したい。

「愚者は経験に学び、賢者は歴史に学ぶ」。これは19世紀のドイツで鉄血宰相と呼ばれたオットー・フォン・ビスマルクが語ったとされる有名な言葉である。ただし、実際には「自分の経験から学ぶのは愚者だけだ。私は、自分が誤るのを避けるため、他人の経験から先に学んでおくことを好む」と語ったらしい。

ビスマルクの見立てに従えば、人間より人工知能の方が圧倒的に賢者に近いと言えそうだ。ネット上に充満する社会の知恵、データから学び取ることができるからだ。つまり、社会の中に潜む多くの人やモノの中にある知恵を集めた「集合知」を学んでいるのである。また、たとえ目の前のコンピュータが学んでいないことも、ネット上のどこかのコンピュータが学んでいれば、その知恵を即座に共有できる。驚異的以外の言葉が見つからない。人工知能ほど大規模で、迅速な経験の共有は、どんなに優秀な人間でもできないのではないか。

経営学者である一橋大学名誉教授の野中郁次郎氏は、言葉や論理で表現可能で、多くの人と共有できる知恵のことを「形式知」と呼んでいる。あらゆる学問の成果、孫子の兵法、ビジネススクールなどで学ぶフレームワークなどは、言葉や論理で成果を表現した、典型的な形式知である。前述したパターン認識の例では、ルールベースのパターン認識が、形式知を利用した方法だと言える。一方、言葉や論理でうまく表現できない知恵を「暗黙知」と呼んでいる。職人の技や天才のひらめきが、これに類するものだ。そして野中氏は、革新的なものを生み出すためには暗黙知が欠かせないとしている。なぜか。言葉や論理で表現できることは常識であり、常識で生み出したものは革新ではないからだ。

機械学習は、その場の空気、文脈、時代の気分をありのままに感じ取って、整理し確率的にもっともらしい結果を見つけ出し、それを判断や未来の予測に生かす技術である。学習結果は、人間にとって分かりやすい言葉や数式ではなく、コンピュータの中で実行する複雑なデータとなる。そこには、人間にとっては暗黙知となる知恵が含まれる可能性が高い。人工知能にとっての常識が、人間にとって非常識になることもある。ただし、これは痛し痒しだ。機械学習は天才の能力をコモディティ化*4してしまう可能性をはらんでいる。

Copyright©2011- Tokyo Electron Limited, All Rights Reserved.