No.010 特集:2020年の通信・インフラ
連載01 人工知能の可能性、必要性、脅威
Series Report

報酬を与えて学習効果を上げる

ロボットのような複雑な動作をする機械に、「教師あり学習」で正しい動作を簡単に教え込むための技術も開発されている。「強化学習」と呼ぶ技術である。

さまざまなパーツの動きを連動させながら動かす機械に「教師あり学習」を施すためには、一連の動きをパーツ一つひとつの動きに分解し、それぞれを個別に人工知能に教え込む必要がある。これは大変な重労働だ。強化学習では、教師は、正しい行動や正解データを教え込まない。機械の動作結果を評価し、結果に応じた報酬(新たな情報や知識)を与えるだけだ。人工知能が自ら、より多くの報酬が得られるように、試行錯誤して最適な動きを学習していく。えさを与えながら動物に芸を教えるのと同じ手法である。

人工知能の強化学習には、通常の「教師あり学習」では実現できない、さまざまなメリットがある。例えば、機械の動作環境に考慮しにくい摩擦や誤差があったり、想定外の事態に遭ったりといった場面でも、動作結果に応じた報酬だけを決めておけば、人工知能が自律的に対応する。これは、宇宙や海底などの探査や、人間では対応できない速い動きが要求される応用で威力を発揮する。

人間では手に負えない複雑な制御を実現

普通の人間がとても考えつかないような複雑な機械の制御方法を見つけ出す技術の研究も進められている。ロボットや自動運転車を高度化していくためには、数多くのセンサから収集したデータを用いて数多くのモーターを制御する、極めて複雑な制御方法の開発が欠かせない。例えば、五本指を持ったロボットの手を作り、卵をつぶさないように持ち上げるような場合。五本指それぞれにかかる力をセンサで検知し、その結果を反映して、それぞれの指を連携させながらやさしく多数のモーターを動かす必要がある。1本の指のセンサとモーターを制御するだけならば簡単だが、5本の指を最適連動させることはとても難しい。人間が考えるような単純で整理された制御の手順では対処不能になる可能性がある。

こうした課題に向けた技術が、グーグルが2014年に買収したベンチャー企業「ディープマインド」の研究を基にした、「ニューラル・チューリングマシン」と呼ぶ技術である。この技術は、過去に学習に使ったデータやその結果生み出した解決方法を、外部記憶装置に蓄積。これを再利用することで未知の作業にも対応できる。この技術の画期的な点は、人工知能が過去の資産を基に、新しい解決方法を作り出せる点だ。

現時点では、入力データ量が小さく、人間が考えるような単純な手順の解決方法で解ける問題しか扱えていない。しかし今後は、人間では作り出すことができない複雑な解決方法を学習できる可能性がある。

ニューラルネットワークを半導体チップに

また、ニューラルネットワークを半導体チップ化し、人工知能の高性能化、小型化、低消費電力化、低コスト化を図る取り組みも、さまざまな企業が進めている。その代表的なものが、IBM社の「TrueNorth」である(図5)。

IBM社のニューロチップ「TrueNorth」の図
[図5] IBM社のニューロチップ「TrueNorth」
出典:IBM社

このチップには64×64個、合計4096個のプロセッサコアが実装されており、人間の脳における100万個のニューロンと2億5600万個のシナプス(ニューロン間の接続)の機能が集積されている。また、各コア内には重み値などを記録するメモリーがあり、他のコアへの結合も記憶されている。これを複数個並べればニューラルネットワークの1層分を構築でき、さらに多層化すれば深層学習向けのハードを簡単に構成できる。米国の半導体メーカーであるインテルやクアルコムも同様のチップを開発している。

人工知能は、現時点で既に人間の能力を凌駕している部分がある。しかもその能力は、さらに進化している。次回は、そんな人工知能に死角はないのか。そして、これからの私たちはどのように人工知能と向き合っていくことになるのか、考えていきたい。

[ 脚注 ]

*1
プログラミング高級言語: コンピュータを動作させるプログラムを、機能や処理の流れを開発者が理解しやすい表現で開発するためのプログラム記述用の言語。
*2
第5世代コンピュータ: 通商産業省(現在の経済産業省)が1982年に立ち上げた、日本のコンピュータ産業を世界の最先端に押し上げることを目的とした国家プロジェクトの開発目標。プロジェクトは1992年に修了したが、このプロジェクトをキッカケにして日本の人工知能関連の研究者が厚みを増したと評価する声もある。
*3
エキスパートシステム: 専門的な知識を持つ人の判断能力を模倣したコンピュータシステム。
*4
コモディティ化: それまでと同じ手法では、競争上の優位性を保てなくなること。
*5
重み値: 重要性に応じて配分した得点のようなもの。
*6
グラフィックスチップ: パソコンなどの動画やグラフィックスのデータ処理速度を向上させるために設計された、大量のデータに同じ計算を同時に実行するのに向いた構造を採った特殊なプロセッサー。

Writer

伊藤 元昭

株式会社エンライト 代表。

富士通の技術者として3年間の半導体開発、日経マイクロデバイスや日経エレクトロニクス、日経BP半導体リサーチなどの記者・デスク・編集長として12年間のジャーナリスト活動、日経BP社と三菱商事の合弁シンクタンクであるテクノアソシエーツのコンサルタントとして6年間のメーカー事業支援活動、日経BP社 技術情報グループの広告部門の広告プロデューサとして4年間のマーケティング支援活動を経験。2014年に独立して株式会社エンライトを設立した。同社では、技術の価値を、狙った相手に、的確に伝えるための方法を考え、実践する技術マーケティングに特化した支援サービスを、技術系企業を中心に提供している。

http://www.enlight-inc.co.jp/

Copyright©2011- Tokyo Electron Limited, All Rights Reserved.