JavaScriptが無効になっています。
このWebサイトの全ての機能を利用するためにはJavaScriptを有効にする必要があります。

Science Report
サイエンス リポート

生成AIは問いかける。「知性」とは何か?前編

産業革命に匹敵するインパクトが、人とAIのハイブリッド型社会をもたらす

文/神吉 弘邦
2023.03.08
生成AIは問いかける。「知性」とは何か?

Ascannio / Shutterstock.com

生成(ジェネレーティブ)AI*1の試行がSNSを中心に盛り上がりを見せている。最初のざわめきは2022年7月。画像生成「Midjourney」がオープンベータ版になってからだ。任意のテキストからAIが生成するのは、過去の画家の筆使いも忠実に再現する、さまざまなタッチの絵。非商用の場合は無料で利用可能、生成画像を自由に投稿できるとあり、瞬く間にツイッターのタイムラインを埋め尽くした。次の衝撃は同年11月。チャットボット型AI「Chat GPT」の公開だ。いまや全メディアの関心事と言っていいだろう。その熱狂から離れて、ユーザーの岡島礼奈さんと研究者の暦本純一さんに聞いた。

Midjourneyの登場以降、AIの研究開発スピードがすさまじいことが明かされた。一般の人々にとって、その実感はオープンAIがバージョン3として公開した「Chat GPT」の登場で決定的になった。優れた分析や評論、投資家に向けたビジネスレポート、開発者の極秘インタビューなどが山のように出されている。1つの技術的話題にこれほど皆が熱中するのも久しいのではないか。

2023年2月中旬の情報と断りつつ、現状の「スナップショット」を残すと、日に日にバージョンを上げるChat GPTは、無料のリサーチプレビューに加えて、有料プランを公開。マイクロソフトが検索エンジンのBINGに組み込んだことで、ウェブブラウザーのEdgeがチャットボット型AIの入口になった。一方、グーグルが言語生成AI「LaMDA(ラムダ)」を利用したチャットボットサービス「Bard」を対抗馬としてリリースしたものの、投資家からはChat GPTに劣っていると判断され、一時、グーグルの株価が大きく下落する。

Chat GPTのどこが感覚的に伝わるすごさなのか。まず、かなり複雑な問いかけに対しても、質問を「理解」し、まるで画面の向こうで「考えている」かのように、思慮深い回答が返ってくる。これまでお決まりの回答が用意されたチャットボットとは雲泥の差がある。膨大な量のデータを深層学習し、テキストをデータの羅列として返すと思われていた生成AIに対して、人間のような「知性」や「意志」を感じる人が増えたという現状だろう。

画像生成AIの場合、依頼したテキストの絵がGAN(敵対的生成ネットワーク)によって時間を置かずに生成され、その結果を元に、ユーザーが求める絵にブラッシュアップしていくという使い方に限定される。しかし、Chat GPTではテキスト入力により、計算やレポート作成はおろか、プログラミングや作曲といった高度な作業を人間の代わりにこなせることも知られてきた。

おそらく自己紹介を当人(当AI)にさせたほうが早いだろう。質問のテキストは筆者、回答はChat GPT(2023年1月下旬〜2月上旬バージョン)によるものである。

質問1:Chat GPTの元になるGPTとは?

Chat GPTによる回答1:GPT(Generative Pre-trained Transformer)は、オープンソースの言語処理技術であるTransformersをベースにした、自然言語処理のための深層学習モデルです。GPTは、大規模なテキストデータセット(例えば、WikipediaやBookCorpusなど)を事前に学習し、その後、特定のタスクに対してファインチューニングすることで、高度な自然言語処理タスクに用いることができます。

GPTの初期のバージョンは、OpenAIが開発したもので、その後、GPT-2やGPT-3といった改良版が発表されました。これらのモデルは、自然言語生成、質問応答、文章生成、文章要約、機械翻訳など、多様なタスクにおいて、非常に高い性能を発揮しています。

質問2:GPTの改良の歴史を、順に教えて。

Chat GPTによる回答2:GPT(Generative Pre-trained Transformer)は、その初期のバージョンであるGPT-1から改良を重ね、GPT-2やGPT-3といったバージョンが発表されています。以下に、GPTの改良の歴史を順に紹介します。

  1. GPT-1:2018年6月に発表された、初めてのGPTモデルです。GPT-1は、12層のTransformerエンコーダーから構成され、OpenAIが作成したWebTextデータセットを用いて学習されました。

  2. GPT-2:2019年2月に発表された、GPTの改良版です。GPT-2は、GPT-1よりも大規模なモデルで、1.5億のパラメータを持ちます。GPT-2は、より多様なタスクに対応できるように改良され、より自然な文章生成が可能になりました。しかし、GPT-2は、公開されたサンプルによる悪用の可能性があるため、一部のモデルは公開されていません。

  3. GPT-3:2020年6月に発表された、最新のGPTモデルです。GPT-3は、最大で1.75兆のパラメータを持ち、前世代のモデルよりもはるかに大きく、高性能な自然言語処理を実現しています。GPT-3は、多様なタスクに対応できるように改良され、さまざまな言語に対応できるようになりました。GPT-3は、最近の自然言語処理の進歩を象徴するモデルの1つとされています。

Chat GPTのトップ画面
[図1]Chat GPTのトップ画面
OpenAI(アメリカ)による「Chat GPT」のエントランスサイト

労働市場に対してのインパクトは大きい

生成AIに触れるユーザーは、どんな感想を持つのか。2022年末、CBインサイツ(アメリカ)が生成AIについて調査・分析したレポート記事*2に寄せられたコメントの一文が目に止まった。「人間でしかありえないクリエイティビティとは何だろうと考えさせられる」。投稿者は、ALE代表取締役CEOの岡島礼奈さんだ。SFにも造詣が深い岡島さんに、事業との関連も含めて聞きたくなった。

ALEは宇宙に関する事業を行う日本のスタートアップ。観光・エンターテイメント分野のプロジェクトとして、人工流れ星「SKY CANVAS」の実現に挑んでいる。一方、大気データの取得と分析を通じて、気象現象の解明など基礎科学の発展に寄与することも目指す。また、人工衛星などの宇宙機が、使用後にデブリ(宇宙ゴミ)化することを防ぐ技術の開発をJAXAと共同研究している。

岡島礼奈氏
岡島礼奈さん
1979年、鳥取県生まれ。東京大学大学院理学系研究科天文学専攻にて博士号(理学)を取得。修了後、ゴールドマン・サックス証券へ入社。2009年から人工流れ星の研究をスタートさせ、11年9月にALEを設立。SF小説のファンでもある

天文学を修めた岡島さんは、AIの専門家ではない。あくまでAI研究の1ファンの立場からと断ったうえで「すごく先だと思っていた未来が、前倒しで来たイメージになった」と語る。

「数年前、シンギュラリティ*3論が盛んだったときは遠い未来のことだと思っていました。でも、最近の生成AIに触れると、もうそこまでシンギュラリティが来ているとさえ感じます。AIの専門家はもっと解像度が高く見えているはずですが、素人的な立場で『AIが自然に溶け込んでいる未来』が想像しやすくなった。私は新しいものが好きなのでワクワクするし、同時に『これから人間はどうするのだろう?』という疑問も湧きます」

AIの発展とともに巻き起こる議論に「AIが人の仕事を奪う」というものがある。実際、岡島さんも「労働市場に対してのインパクト」を直感している。例えば、Chat GPTは論文の英文校正などで精度がかなり高く「今後は翻訳を校正する業者さんに頼まなくても済む、と言う研究者の方々が身近にもいる」と明かす。

その一方で感じる課題がいくつかある。まずは、自信たっぷりに「間違った答え」を告げること。Chat GPT利用時、多くの人が「あれっ」と思った瞬間があるだろう。「日本語の難しさもあるでしょうが、AIが学習のデータベースとしている情報に偏りを感じます。あるとき電車の乗り換え案内を尋ねたら、JR新宿駅から新幹線が発着することになっていました」。

仕事をバリバリこなす優秀なアシスタントが、唐突に常識外れな回答をしてくる。人間の脳を模したニューラルネットワークの「教師なし学習」で新たな意味を自ら生成するといえど、参照しているネット上の情報が正しいものとは限らない。ユーザーの「分断」が増えそうだとも岡島さんは考える。

「嘘をつく相手から正しい情報を引き出すのは大変なので、使う側にもある程度の知識が必要。原理原則から考えられて、情報の正しさがわかる人じゃないと現段階では使いこなせないだろうと感じます」

日本の話題にChat GPTはどれだけ通じているか。
2020年に亡くなったコメディアンの志村けんが、長年「変なおじさん」を演じた理由を尋ねる。スラスラ答えが返ってくるのに驚くが、通りいっぺんの解説からは「よく考えずに執筆されたレポートを読まされる教師の気分」になる。法学部や医学部の試験に合格する知的水準に達したと言われたChat GPTだが、美術や演劇といった科目で及第点を取るのは現状では難しそうだ
Chat GPTの解答 Chat GPTの解答
Chat GPT, 2023年2月

Chat GPTが編み出すのは、膨大なデータセットから妥当性をもとに抽出されたテキストであり、その配列は「意味」を考えて生成されたものではない。そこに意味付けするのは、あくまで人間の側だ。誰にも当てはまる事柄で辻褄合わせした文章には知性を感じず、どうにも薄っぺらい。

岡島さんも手厳しい。「現実にも、そういった『知識のつなぎ合わせ』だけで生きているような人は見かけます。でも、逆に言えば、そういう人物とAIの回答は、ほとんど区別がつかない。だからこそ、社会にインパクトを与えるのかもしれません」。将来、ネット上の情報を代表したAIによる生成テキストが、唯一の「正解」とされる社会*4が来ないのを祈るばかりだ。

サイエンスの発展を後押しするAI

一般の利用者が急増するChat GPTは、ユーザーが自分の仕事に関連する作業を試した結果、実用的なレベルで驚いたとの感想が多い。今後、ALEのような宇宙に関する事業を行う会社では、どんな応用が考えられるだろう。

岡島さんは「人工流れ星をこの場所の空で流すと盛り上がりそう」という具合に、ネットの情報を整理してニーズを分析する予測はできるかもしれないと言う。ただ、そこにAIを利用する必要性があるかは不明だとも加えた。まだAIは、リアルタイムで起こっている現実の情報を扱うのに向かないのだろう。

[図2] ALEのSKY CANVAS
[図2]ALEのSKY CANVAS
ALE のSKY CANVASプロジェクトでは、打ち上げる人工衛星に流星源(流れ星の素になる粒)を搭載。位置・方向・速度をコントロールして放出することで、人工流れ星を発生させる。天然の流れ星と比較してより長く発光することが特徴という
https://youtu.be/UxwPergAQjg

ただ、AI自身がリアルな世界のデータを取りに行き、分析する日も遠くないだろうと岡島さん。「もし、実空間のデータを取り込むAIが出てきたら、私たちの『大気データ』の分析処理で活躍すると思います。防災などにも役立てられそうです」

ALEの大気データ分析
[図3]ALEの大気データ分析
ALEは独自の人工流れ星、小型衛星、プラズマ技術を活用し、これまで観測が十分にできていなかった対流圏から中間圏の大気データを高頻度で取得。気象予報精度の向上と、中⻑期の気候変動メカニズムの解明に貢献することを目指している
https://youtu.be/v3RbDzLZMPI

生成AIが、あらゆる分野で研究者のサポートができることは、数々のユーザーによって実証されつつある。岡島さんは「サイエンスに特化したAIと、生成AIの連携が増える」と見る。一例は、AlphaGo*5で名を馳せたDeepMind(イギリス)の構造解析AI「AlphaFold2」。2022年7月、現在知られているタンパク質の立体構造2億種の予測情報をデータベースとして公開した。同社のデミス・ハサビスCEOは「これはAIによる社会への贈り物だ」とツイッターで述べている。

AlphaFold2
[図4]AlphaFold2
DeepMindとEMBL-EBI(欧州バイオインフォマティクス研究所)による「AlphaFoldタンパク質構造データベース」のサーチ画面
https://alphafold.ebi.ac.uk/

「このデータベースをもとに、例えば、創薬や環境汚染問題の解決などが進みます。私が面白いと思う使い方は、AIによってサイエンスが発展していく方向です」。深宇宙にも想いを馳せる岡島さん。将来、地球外生命の探査などにもAIの成果が役立てられるかもしれない。

後編に続く

[ 脚注 ]

*1 生成AI
画像やテキスト、音楽やプログラムなど、人間が意味や価値を見出せるコンテンツを生み出すAI。人間が作成したデータと、AIが作成したデータを識別して自身で学習(教師なし学習)することで精度を上げていく。ジェネレーティブ(generative)AIとも呼ばれる。
*2 米CBインサイツが生成AIについて調査・分析したレポート記事
画像・対話・作曲…生成AI系スタートアップ多彩に、日本経済新聞、2022.12.26
*3 シンギュラリティ
レイ・カーツワイル博士による未来予測の概念。AIが人間の知能を大幅に凌駕することで、社会が決定的な変化を迎える「技術的特異点」が、2045年ごろに到来するとしている。2007年の著書『ポスト・ヒューマン誕生:コンピュータが人類の知性を超えるとき』で唱えた。
*4 AIによる生成テキストが、唯一の「正解」とされる社会
共著に『問いのデザイン 創造的対話のファシリテーション』がある京都大学総合博物館の塩瀬隆之准教授は、教育において「問い」の力が弱まる現状に、次のような警鐘を鳴らす。「学校では、教科書に載っていることはすべて、その時点で正解とされていることだという前提で入るから。情報の受け取り方が、純粋培養された無菌室みたいな状態になっているんですよね。(中略)『みんながネットで言っているから、それが正しいと思って当然だよね』っていう先生が再生産されていくと、子どもたちは疑う機会がなくなってしまう」。
問う行為そのものを肯定し、問いを味わって楽しむ方法を伝えたい。京都大学総合博物館准教授・塩瀬隆之さん【インタビューシリーズ「時代にとって大切な問いを問う」】、ミラツク、2020.08.16
*5 AlphaGo
グーグル傘下のDeepMind社(イギリス)が開発した、ニューラルネットワークを利用したコンピュータ囲碁プログラム。局面が限られるチェスや将棋に比べ、囲碁でAIが人間に勝つのは難しいとされていたが、2016年に世界トップレベルのプロ棋士であるイ・セドルを五番勝負で破った。
Writer

神吉 弘邦(かんき ひろくに)

1998年、慶應義塾大学(SFC)環境情報学部卒業後、日経BP入社。パソコン誌編集部に配属。

その後、文芸出版社での書評誌創刊を経て、2002年から8年間、日英併記のデザイン誌「AXIS」編集部。

2010年よりフリーランス。デザイン誌、建築誌、テクノロジー誌、ビジネス誌、カルチャー誌など、オンラインと紙の両メディアで編集・執筆を行うほか、企業の複数メディアで企画や立ち上げの支援、コピーライティングを担う。

2012年から「TELESCOPE Magazine」に参加。Cross Talk(スペシャルセッション)、Interview(サイエンティスト・エキスパートインタビュー)、Laboratories(研究室紹介)のコーナーに寄稿してきた。

2018年〜2020年、自然と科学をテーマにしたウェブマガジン「NATURE & SCIENCE」(アマナ)編集長。

2021年より経済誌「Forbes JAPAN」コントリビューティング・エディター。

https://www.linkedin.com/in/hirokuni-kanki-b4a04716/

あわせて読みたい

Science Report

新着記事

よく読まれている記事

Loading...
Loading...