No.002 人と技術はどうつながるのか？

Japanese
English

シェア

0
Tweet

音声認識技術はどこに向かうのか？

ユーザーインターフェイスを超え、人工知能、エージェントへ

2012.07.09
文／山路達也

iPhoneのSiriを始め、音声認識技術を活用したユーザーインターフェイスが注目を集めている。ビッグデータの活用による音声認識処理速度の高速化や、声の状態から感情やストレスを理解する技術など、新しい技術の開発や応用が進んでいる。なぜ、今、音声認識なのか？　これまでの開発と研究の歴史を振り返りながら、注目が高まる音声認識の可能性を探る。

人間の音声を数式でモデル化する

音声入力インターフェイスが、急速に注目を集め始めている。

日本でも1990年代からパソコン用の音声入力ソフトウェアはあったし、音声認識で電話帳を検索できる携帯電話端末もドコモから発売されていたが、それほど話題に上ることはなかったように思う。

米国では1990年代から音声認識技術を利用した製品やサービスが普及してきたが、一般向け製品としてブレークしたのは、アップルのiPhoneに搭載されたSiriということになるだろう。iPhoneに話しかけるだけで、スケジュールの入力や、メッセージの送信、ウェブ検索などが簡単にできる。「人生」とは何かをSiriに尋ねると、ちゃんと「42」と答えてくれる（SF小説『銀河ヒッチハイクガイド』に出てくる、有名なジョーク）。ユーザーは、知性的だけれど、少し抜けたところもあるSiriのキャラクターを好意的に受け止めているようだ。

1987年に、アップルは「Knowledge Navigator」という未来の情報端末のコンセプトを発表していたが、Siriこそがそれを具現化したものだと熱狂しているユーザーもいる。

Androidにも音声でスマートフォンの操作を行えるGoogle Voice Actionが搭載されているし、Siriのようなパーソナルアシスタントアプリも登場している。また、モバイル用のGoogle検索アプリでは音声検索機能が付いている。

音声でデジタルデバイスを自在に操ることが現実となり、人工知能の登場まであと少しという気すらしてくる。

今一つブレークせずにいた音声認識によるユーザーインターフェイスが、これほど注目されるようになったのは、何か画期的な進歩があったのだろうか？

テクノロジーとアートの境界面から
人間について考える。

: 感覚・体験を共有する
タッチ・インターネットが拓く未来

: 人工知能からHCIへ

: アートとエンジニアリングの間から見る未来

: スイッチ大全

: iPhoneはなぜ、
気持ちがよいのか？

: 音声認識技術は
どこに向かうのか？

: 3Dインターフェイスの現在

: ヒューマンインターフェースの歴史

: ヘッドマウント
ディスプレイは来るのか？

: 広告はどこまで
生活に入り込むか

: ミニマルデザインとしての
日本のインターフェイス

: 21.3.22

タンパク質構造予測を可能にするAI

: 21.3.8

ロケットエンジンの課題を解決する「折り紙式」燃料タンク

: 21.2.22

AI顕微鏡は、数分でガン細胞を見つける

: 21.2.8

太陽エネルギーを数ヶ月から数年保存する新素材

: 21.1.26

完全にフラットな⿂眼レンズでカメラが変わる

Copyright©2011- Tokyo Electron Limited, All Rights Reserved.