生成AIは問いかける。「知性」とは何か？ | サイエンスリポート | TELESCOPE magazine

#タグ

生成（ジェネレーティブ）AI^*1の試行がSNSを中心に盛り上がりを見せている。最初のざわめきは2022年7月。画像生成「Midjourney」がオープンベータ版になってからだ。任意のテキストからAIが生成するのは、過去の画家の筆使いも忠実に再現する、さまざまなタッチの絵。非商用の場合は無料で利用可能、生成画像を自由に投稿できるとあり、瞬く間にツイッターのタイムラインを埋め尽くした。次の衝撃は同年11月。チャットボット型AI「Chat GPT」の公開だ。いまや全メディアの関心事と言っていいだろう。その熱狂から離れて、ユーザーの岡島礼奈さんと研究者の暦本純一さんに聞いた。

全ての仕事がAIとの共同作業になる

未来の社会像や将来の研究スタイルを、AIがどう変えていくのか。コンピュータサイエンスの現場からの意見も聞いた。ソニーコンピュータサイエンス研究所副所長の暦本純一さんは同研究所の京都研究室室長を兼任し、現在は東京に加え京都も活動拠点にしている。

暦本純一氏 — 暦本純一さん

1961年、東京都生まれ。東京工業大学博士（理学）。専門はヒューマンマシンインタラクション。NEC、アルバータ大学留学を経て、94年ソニーコンピュータサイエンス研究所入社。2007年より東京大学大学院情報学環教授。クウジット創業者。SF映画にも造詣が深い

AIの活況について感想を尋ねると「おそらく『産業革命以上の変化』なので面白いとしか言いようがない」という率直な答えが返ってきた。

「ディープラーニングの研究が始まった当初は、画像認識の領域くらいにとどまっていた。でも、この数年ぐらいで社会がひっくり返るようなものがどんどん出てきている。産業革命は実際にはかなりゆっくり起きたわけですが、それ以上の変化が極めて短い期間で起きると思う。現在のAIはまだ先の答えがわからず、全員が雪崩に巻き込まれているような状況。グーグルなどですら、どこに着地するかわからないままに走っている感じです」

Midjourney、DALL-E2、Stable Diffusion……昨夏より話題になった画像生成AIが社会に及ぼすインパクトは補足可能なレベルだったと暦本さん。具体的には、漫画やイラスト、アニメーションといったコンテンツの自動化によって、既存の業態が変わるという見通しだ。

「AIをツールとして使いこなす作家によって世代交代が起きる。最初のアイデアを考えるのは人間ですから『自分では絵が描けないすごい漫画家』が出てくる。映画のようなコンテンツのトータルな構造までをAIが手がけるかわかりませんが、背景画のレンダリングなどはすでに始まっている。人間＋AIで産業が進むのは確実で、どの領域に人間が残るかがポイントだと思います」

［図5］Midjourneyの画面

Midjourneyでは、Discodeを使って絵の生成やユーザー間のコミュニケーションを行う。ネット上のビジュアル素材を組み合わせて新たな画像が生成される様は、他人が見ている夢を覗き見するような感覚がある
https://midjourney.com/

一方、自然言語を扱うChat GPTが示した産業へのインパクトははるかに大きかった。なぜなら、文章を読み書きするという行為は、ほぼすべてのホワイトカラーの仕事に関わるからだ。数年後には全員、何らかのかたちでAIと一緒に仕事するようになるだろう、と暦本さんは予測する。

「半ばジョークですが、論文で第3著者ぐらいに『Chat GPT』の名前を入れるのが流行っています。10年以内に、実質的な研究者である第1著者になれれば面白い。今後は、対談のようにAIとしゃべりながら『じゃ、ここまでを論文にしといて』と指示したら、『ハイできました』と出力される状況は十分に考えられます」

［図6］ソニーCSL京都

2020年に開設したコンピュータサイエンス研究所京都研究室。現在は4人の研究者を中心に、土地の文脈にも根ざした研究がなされている

AIによってなくなっていく仕事もあるだろうが、暦本さんは職種そのものが消えるというよりも、AIとともに変質していくイメージを描く。

「全ての仕事は、AIの作業と『ハイブリッド』化が進むと思います。例えば、今の大学教員は学生の論文添削などに追われていますが、基本的にその部分をAIに任せて、研究の本質的な部分に時間を充てられます。今、インターネットを使わないという仕事はほとんどないと思いますが、それと同じぐらいAIを使うことは、あらゆる産業にとって当たり前になる」

確かに筆者自身もこの原稿を含め、インタビューの文字起こし作業でAIの助けを借りる場面も増えた。暦本さんは「これから自分の仕事がどうなるか誰も知らない状態」だというスタンス。だからこそ「変化することが面白いという立場が大事」と語る。そのほかに、制度設計面の課題も挙げた。

「もう司法試験に受かるAIはつくれそうですが、そのAIが弁護士業務をしていいのかというと、まだダメですよね。ポテンシャルとしてのAIの能力と、社会が制度として能力を受け入れられるかにはかなりタイムラグがある。そこを乗り越えられる分野なら、この2〜3年で実用化されるAIがどんどん増えるのでは」

人のつくることの価値は増していく

Chat GPTが発表されて爆発的な話題となったのは2022年の11月だが、オープンAIがGPT-3を公開したのは2020年5月。最初のGPTの公開は2018年にさかのぼり、当時は一般ユーザーの話題になるほどの技術とは認識されていなかった。なぜ、最近になって研究が加速したのか？

暦本さんは、コロナ禍における「社会の変化」と「AIへの注目度」が無関係ではなかったと考える。「この数年間、社会は『本当に全員でテレワークできるか？』を強制的に試されるリモート化の実験場のようになりました。ディープラーニングはその状況と独立した研究ながら、シンクロした部分がある」。つまりはリアルな世界とデジタルの世界の垣根が低くなった結果、社会へのAIの実装をあと押ししたという仮説だ。

コンピュータサイエンスの研究者である暦本さんは、音楽や食、ワインなどの知識にも通じている。話題は、AIの台頭で「かえって価値が高まる仕事」の話になった。

「情報の分野でAIの発展がすごく進むものの、物質に対してはちょっと大変かもしれないのが面白いところです。例えば『AIでレシピつくる』はできそうですが、『味見ができるロボット』のほうがむしろ難しい。レシピなどをデータサイエンスで考えることはできても、『あっちよりこっちが美味しい』といった料理の微妙な差異、最終的に物質にするフィジカルの面は、まだ苦手だと思います」

人の手が作るもの、わかりやすい例では伝統工芸のような分野の価値が増すというところだろうか？

「そう思います。AIがデザインした西陣の着物の柄はあっても、そこに『価値』を与えるのは、現実の布地として織り上げられたという事実です。AIが入ってくると、むしろ『物質』や『文化』といったものの価値が高まっていく。我々が京都にラボを設けたのも、そんな意識があったからです」

暦本さんの近年の研究トピックは「ヒューマンAIインテグレーション」。AIと人間の境界を行ったり来たりしながら、どういった組み合わせが一番いいのかを探る内容だ。生成AIのほかに注目している技術も聞いた。

「空間をセンシングして3次元をそのままニューラルネットに再現するNeRF^*2です。以前ならCGとしてポリゴン化していた3Dスキャンを、3次元の光そのものを取り込む技術です。機器や解析ソフトウェアの向上で精度が上がり、速さもほとんどリアルタイムになりました。3次元再構築にニューラルネットが入ったのは大きいです」

ソニーCSL京都の茶室 — ［図7］ソニーCSL京都内の茶室「寂隠（じゃくいん）」

2023年2月27日、報道陣に公開されたデジタル技術を活用した茶の湯文化の探究・拡張例。京都研究室内にしつらえられた茶室は、3次元でセンシングされており、VR空間内で再現される
監修：茶美会文化研究所 / 設計・施工：数寄屋建築茶美会 / 撮影：小笠原敏孝

「あとは裸眼立体視ディスプレイ。ゴーグルをかけている限り、VRはゲームより先に行けません。でも、ヘッドマウントディスプレイを被らずに立体を見られる技術が普及しだしているので、おそらく『3次元の庭の映像が家の中で立体感をもって映し出されている』という光景が5年以内ぐらいに実現しているでしょう。オンライン会議も、目の前で3次元投影された等身大の人と話せるようになる。リアルとバーチャルを隔てる壁が本当になくなる時代になると思います」

ハードウェアの側で膨大な計算力も必要になりそうだが、それを少ない計算量で実現する研究も進んでいる。コードの改良にAIが関わるのも非常にあり得る未来だと暦本さんは考えている。

同時に進む「リアルとバーチャル」のハイブリッド化

効率的にテクノロジーで回せるようになり、作業がAIで自動化できる未来。冒頭で岡島さんが掲げた「これから人間はどうすればよいのか？」という疑問に対して、暦本さんの答えは明快だ。人間はやりたくないことをやらずに「やりたいことをやればいい」。

「やるべきこと、ではなく、自分でやりたいと思うことです。例えば、自分でピアノが弾けるのと、AIが横でピアノを弾いてくれるのとでは、嬉しさが全然違いますよね。自分でできるというのは、人間の『根源的な嬉しさ』です。自分でできること、自分でしたいこと、この体験を取られてしまったら嫌だなと思うこと。それらは人がやったほうがいい。テクノロジーはそれをサポートするためのものです」

図らずもAI が私たちに問うのは、「自分にとって何が大事か」「何をしているときに生き生きとした気持ちを感じるか」という幸福論だ。「料理の例が出ましたが、実はそういうところが大事になる。『豊かさ』や『幸せ』を感じる瞬間には、人間のオーガニック（有機的）なことが根ざしています。世の中の技術が進んでも、そこは変わらない。むしろ技術が進むことで豊かさや幸せをさらに追求できる時代になると思うのです」

ただし技術一辺倒ではなく、両輪を考える必要があるという。暦本さんは一例として、仮想空間との関わり方を挙げる。「誰もが便利なスマートシティに住み、24時間メタバースで暮らしたいかといえば、そうではない部分もあるでしょう。メタバースの時代にも全部がバーチャルに行くとは思っていなくて、リアルがあってこそバーチャルがある。季節感もそうですが、お酒や食べ物はリアルでしか味わえないですから。両方のハイブリッドで『いいとこ取り』ができないかを考えています」

身体を持たないAIは、バーチャル空間に住まわせるのが楽だと暦本さんは言う。「リアルな世界で作業するヒューマノイドのロボットをつくるのは大変です。でも、バーチャルのAIエージェントはすぐにできる。これからハイブリッドの上手な会社のビジネスがドーンと進むと考えています」。

AIの裏側に「人間のような気配」を感じさせられれば、人間が操作するアバターとの区別がなくなるだろう。やはり人間とAIのハイブリッドが進んでいくのだろうか。東大の暦本研究室のプロジェクトでも、そう感じさせるユニークな研究がある。人間の上に「AIの皮を1枚被せてみる」試みだ。

［図8］サイレントスピーチ・SottoVoce: 超音波画像と深層学習による無発声音声インタラクション（2019）

口腔内の超音波エコー映像により、利用者が声帯を振動させずに「発話」した発声内容をAIが認識。人間とAIとが一体化した新しいインタラクションの方向を示している
出典：東京大学大学院情報学環暦本研究室
https://lab.rekimoto.org/projects/sottovoce/

日本語で話している最中に同時通訳できる時代。動画で口元や表情をリアルタイム加工できれば、画面上で「いかにも英語で話しているように見せる」ことができる。映画の吹き替え作品ではこうした実験がすでに試みられている。

AIが「シンギュラリティ」に至る条件

ふたりの話を振り返って思い起こしたのは、人間の「知性」や「頭の良さ」には2種類、あるいはそれ以上の尺度がある^*3という経験則だった。岡島さんは言う。

「未来に対して希望をもってアプローチできるのが、人間の特性だろうと思うんです。でも、すごく勉強ができる東大生であっても、そこから『新しい未来』みたいなものを見つけるのが苦手な人は多い印象を受けます。今、AIに未来のことを尋ねると、ネットの情報から『こうなると予想されています』という答えは返ってくるけれど、『こうなったらいいな』という答えはなかなか出てきません。ただし『こうしたほうが平和になると思います』みたいな納得できる答えは出てくるんですね。過去から学ぶということが得意なので、結構いいところを突いてくる」

岡島さんは「わけのわからない未来」みたいなものを思い描けるのが人間だと考える。例に挙げたのは街づくり。「AIは優れた建築デザインを全部インプットして、そこから平均値を出すようなことが得意。そうでなく、ここに小学生が暮らして、あそこに病院があって……と実際に住む人の未来を、個人個人のレベルで考えること。なおかつ、これまで見たこともない新しい街を、土地に住んでいる感覚まで再現してつくるのは、まだAIにできないと感じます」。

AIと創造性について、暦本さんも同じところを見ている。「AIがやらないのは、単純に遊んだりすること。今はどうしても目的関数があり、それに対して最適化し、学習するかたちで動いている。マシンラーニングから脱して、AIがマシンプレイングしだしたら面白いですよね」。

マシンプレイングとはどういう意味だろうか。それは将棋やテニスをプレイするという意味ではないという。「ルールのある競技だとゴールがあるから、ラーニングになる。それとは違って、単純に子供が好奇心で遊ぶようなこと。まさにホモ・ルーデンス^*4ですね」。

AI同士が遊んでいるのは、謎の信号をものすごい速度でやり取りするような光景だろうか。「もはや我々に理解できないかもしれませんが、『この現象は笑っているってことじゃないだろうか？』と観測できるかもしれません。そう、AIが笑ったら面白いです。今でも、人間が笑うところを全部学習して『ここはきっと笑うポイントだから笑う』というAIは作れるでしょうけど、そうじゃない。『AIが面白がって遊んでいる、自然に笑っている』という領域に達したら、それは本当にシンギュラリティだと思います」。

人間の「鏡」としてのAIが問うてくるのは、知性とは何か。創造性とは何か^*5。Chat GPT自身にも聞いてみたところ、2023年2月の段階ではこのように妥当な回答を返している。

[ 脚注 ]

*1 生成AI: 画像やテキスト、音楽やプログラムなど、人間が意味や価値を見出せるコンテンツを生み出すAI。人間が作成したデータと、AIが作成したデータを識別して自身で学習（教師なし学習）することで精度を上げていく。ジェネレーティブ（generative）AIとも呼ばれる。

*2 NeRF（ナーフ）: Neural Radiance Fieldsの略。さまざまな角度から撮影した複数の写真から、ディープラーニングを用いて空間における三次元形状を復元、自由な視点から見られる立体画像を生成できる技術。

*3 「知性」や「頭の良さ」には2種類、あるいはそれ以上の尺度がある: トロント大学名誉教授のキース・スタノヴィッチ博士によれば、知性には複数のレベル（形態ではない）があるという。物事の意味を理解したり、論理的に思考できたりする知性が「アルゴリズム的知性」。一方、現実の状況を考慮しながら、目標を実現するために意思決定できる知性を「合理的知性」と呼んでいる。（ジャン・フランソワ・マルミオン編『「バカ」の研究』より）

*4 ホモ・ルーデンス: オランダの歴史家、ヨハン・ホイジンガによる1938年の著書タイトル。人間活動の本質が「遊び」であり、文化を生み出す根源が「遊び」があるという人間観。ホモ・ルーデンス（Homo ludens）とは、ラテン語で「遊ぶ人」。人類の学名であり「賢い人」という意味のホモ・サピエンス（Homo sapiens）に掛けている。

*5 創造性とは何か: 情報学者の長尾真は、著書『人工知能と人間』で、創造性についてこのように述べている。「簡単には新しい物を作りだすこと、その能力であろうが、多くの場合新しいものは既存の物事の新しい組合せによって作り出される。（中略）公理系から演繹規則を使えば新しいものはいくらでも出てくる。しかしすでに述べたようにこれらはすべてトートロジーであり、そこに真の新しさがあるのかどうかは問題である」。

Writer

神吉弘邦（かんきひろくに）

1998年、慶應義塾大学（SFC）環境情報学部卒業後、日経BP入社。パソコン誌編集部に配属。

その後、文芸出版社での書評誌創刊を経て、2002年から8年間、日英併記のデザイン誌「AXIS」編集部。

2010年よりフリーランス。デザイン誌、建築誌、テクノロジー誌、ビジネス誌、カルチャー誌など、オンラインと紙の両メディアで編集・執筆を行うほか、企業の複数メディアで企画や立ち上げの支援、コピーライティングを担う。

2012年から「TELESCOPE Magazine」に参加。Cross Talk（スペシャルセッション）、Interview（サイエンティスト・エキスパートインタビュー）、Laboratories（研究室紹介）のコーナーに寄稿してきた。

2018年〜2020年、自然と科学をテーマにしたウェブマガジン「NATURE & SCIENCE」（アマナ）編集長。

2021年より経済誌「Forbes JAPAN」コントリビューティング・エディター。

https://www.linkedin.com/in/hirokuni-kanki-b4a04716/

生成AIは問いかける。「知性」とは何か？後編

産業革命に匹敵するインパクトが、人とAIのハイブリッド型社会をもたらす

全ての仕事がAIとの共同作業になる

人のつくることの価値は増していく

同時に進む「リアルとバーチャル」のハイブリッド化

AIが「シンギュラリティ」に至る条件

[ 脚注 ]

あわせて読みたい

Science Report

新着記事

よく読まれている記事

あわせて読みたい