No.006 ”データでデザインする社会”
Cross Talk

データの整備を後押しする条件

津田 ── 僕がここ数年追い掛けているのは「インターネットと政治」という分野です。

例えば選挙の分析で、日本でもTwitterの膨大なログをビッグデータ*19として見ながら、例えば民主党だったら民主党、自民党だったら自民党、候補者だったら候補者ごとで言及しているツイートの統計を取る、といった研究をする人が増えたように思います。

新井 ── 実際に増えていますよ。

津田 ── アメリカだったら、例えばオバマとロムニーがツイート分析をやったときに、これはポジティブワードだ、ネガティブワードだみたいな単語を辞書登録して、ネガポジ判定ができるそうなんです。日本はそういう話題がなかなか出てこない。

新井 ── 大統領選では、それがちゃんとお金になっているからだと思うんですね。どの州が本当に取れそうか、みたいな今の動向を把握して、あとどのくらいお金を積んで、どういうCMを流さなければいけないか、という戦略がある。選挙向けにデータをチューニングしたり、整備しておくメリットがあるのでしょう。

日本も人力で言語資源を作らなきゃならないのに、そこに手間やコストが掛かるから、あまりみんなしない。何十億というマーケットになったら、それは大勢が真剣にやりますよね。

津田 ── それは分かりやすい話です。

新井 ── 他の例でも、IBMの「ワトソン*20」は、クイズ番組の「ジョパディ!*21」で人間のチャンピオンに勝ったような人工知能ですが、実際に応用されようとしているのは、医療分野なんです。

医師が電子カルテから診断しようとしたとき、思い込みがあるといけない。そこで人工知能が「こういう症例なら別のタイプの病名もあり得ます」とサジェスチョンをする。これは、医療過誤を防ぐのが目的です。

医療訴訟が多いアメリカでは、そこにお金を投入する意味が病院側にもあるから、ビジネスとして成り立っているのです。

日本語で同じようにデータを整備できるかというと、そこまで裁判が多くないのに本当にやる必要があるのかと言われてしまう。経済面が大きな問題になるのです。

[ 注釈 ]

*19
ビッグデータ: 2000年台から台頭してきたIT用語。ネット化社会で瞬時に多彩なデータの収集が容易となり、またコンピュータのデータ処理能力が向上した時代、巨大な量のデータを解析してさまざまな分野における現状分析や未来予測にあてられるようになった。
*20
ワトソン: IBMが2009年に発表したコンピュータ(質問応答システム)。自然言語による質問を文脈まで理解して回答する。1997年にチェス世界王者と対局して勝利した「ディープ・ブルー」に次いで開発された。
*21
ジョパディ!: 1964年から現在まで米国で放送されている、一般視聴者参加型の長寿クイズ番組。 http://www.jeopardy.com

Copyright©2011- Tokyo Electron Limited, All Rights Reserved.