JavaScriptが無効になっています。
このWebサイトの全ての機能を利用するためにはJavaScriptを有効にする必要があります。
Ascannio / Shutterstock.com
生成(ジェネレーティブ)AI*1の試行がSNSを中心に盛り上がりを見せている。最初のざわめきは2022年7月。画像生成「Midjourney」がオープンベータ版になってからだ。任意のテキストからAIが生成するのは、過去の画家の筆使いも忠実に再現する、さまざまなタッチの絵。非商用の場合は無料で利用可能、生成画像を自由に投稿できるとあり、瞬く間にツイッターのタイムラインを埋め尽くした。次の衝撃は同年11月。チャットボット型AI「Chat GPT」の公開だ。いまや全メディアの関心事と言っていいだろう。その熱狂から離れて、ユーザーの岡島礼奈さんと研究者の暦本純一さんに聞いた。
Midjourneyの登場以降、AIの研究開発スピードがすさまじいことが明かされた。一般の人々にとって、その実感はオープンAIがバージョン3として公開した「Chat GPT」の登場で決定的になった。優れた分析や評論、投資家に向けたビジネスレポート、開発者の極秘インタビューなどが山のように出されている。1つの技術的話題にこれほど皆が熱中するのも久しいのではないか。
2023年2月中旬の情報と断りつつ、現状の「スナップショット」を残すと、日に日にバージョンを上げるChat GPTは、無料のリサーチプレビューに加えて、有料プランを公開。マイクロソフトが検索エンジンのBINGに組み込んだことで、ウェブブラウザーのEdgeがチャットボット型AIの入口になった。一方、グーグルが言語生成AI「LaMDA(ラムダ)」を利用したチャットボットサービス「Bard」を対抗馬としてリリースしたものの、投資家からはChat GPTに劣っていると判断され、一時、グーグルの株価が大きく下落する。
Chat GPTのどこが感覚的に伝わるすごさなのか。まず、かなり複雑な問いかけに対しても、質問を「理解」し、まるで画面の向こうで「考えている」かのように、思慮深い回答が返ってくる。これまでお決まりの回答が用意されたチャットボットとは雲泥の差がある。膨大な量のデータを深層学習し、テキストをデータの羅列として返すと思われていた生成AIに対して、人間のような「知性」や「意志」を感じる人が増えたという現状だろう。
画像生成AIの場合、依頼したテキストの絵がGAN(敵対的生成ネットワーク)によって時間を置かずに生成され、その結果を元に、ユーザーが求める絵にブラッシュアップしていくという使い方に限定される。しかし、Chat GPTではテキスト入力により、計算やレポート作成はおろか、プログラミングや作曲といった高度な作業を人間の代わりにこなせることも知られてきた。
おそらく自己紹介を当人(当AI)にさせたほうが早いだろう。質問のテキストは筆者、回答はChat GPT(2023年1月下旬〜2月上旬バージョン)によるものである。
質問1:Chat GPTの元になるGPTとは?
Chat GPTによる回答1:GPT(Generative Pre-trained Transformer)は、オープンソースの言語処理技術であるTransformersをベースにした、自然言語処理のための深層学習モデルです。GPTは、大規模なテキストデータセット(例えば、WikipediaやBookCorpusなど)を事前に学習し、その後、特定のタスクに対してファインチューニングすることで、高度な自然言語処理タスクに用いることができます。
GPTの初期のバージョンは、OpenAIが開発したもので、その後、GPT-2やGPT-3といった改良版が発表されました。これらのモデルは、自然言語生成、質問応答、文章生成、文章要約、機械翻訳など、多様なタスクにおいて、非常に高い性能を発揮しています。
質問2:GPTの改良の歴史を、順に教えて。
Chat GPTによる回答2:GPT(Generative Pre-trained Transformer)は、その初期のバージョンであるGPT-1から改良を重ね、GPT-2やGPT-3といったバージョンが発表されています。以下に、GPTの改良の歴史を順に紹介します。
GPT-1:2018年6月に発表された、初めてのGPTモデルです。GPT-1は、12層のTransformerエンコーダーから構成され、OpenAIが作成したWebTextデータセットを用いて学習されました。
GPT-2:2019年2月に発表された、GPTの改良版です。GPT-2は、GPT-1よりも大規模なモデルで、1.5億のパラメータを持ちます。GPT-2は、より多様なタスクに対応できるように改良され、より自然な文章生成が可能になりました。しかし、GPT-2は、公開されたサンプルによる悪用の可能性があるため、一部のモデルは公開されていません。
GPT-3:2020年6月に発表された、最新のGPTモデルです。GPT-3は、最大で1.75兆のパラメータを持ち、前世代のモデルよりもはるかに大きく、高性能な自然言語処理を実現しています。GPT-3は、多様なタスクに対応できるように改良され、さまざまな言語に対応できるようになりました。GPT-3は、最近の自然言語処理の進歩を象徴するモデルの1つとされています。
生成AIに触れるユーザーは、どんな感想を持つのか。2022年末、CBインサイツ(アメリカ)が生成AIについて調査・分析したレポート記事*2に寄せられたコメントの一文が目に止まった。「人間でしかありえないクリエイティビティとは何だろうと考えさせられる」。投稿者は、ALE代表取締役CEOの岡島礼奈さんだ。SFにも造詣が深い岡島さんに、事業との関連も含めて聞きたくなった。
ALEは宇宙に関する事業を行う日本のスタートアップ。観光・エンターテイメント分野のプロジェクトとして、人工流れ星「SKY CANVAS」の実現に挑んでいる。一方、大気データの取得と分析を通じて、気象現象の解明など基礎科学の発展に寄与することも目指す。また、人工衛星などの宇宙機が、使用後にデブリ(宇宙ゴミ)化することを防ぐ技術の開発をJAXAと共同研究している。
天文学を修めた岡島さんは、AIの専門家ではない。あくまでAI研究の1ファンの立場からと断ったうえで「すごく先だと思っていた未来が、前倒しで来たイメージになった」と語る。
「数年前、シンギュラリティ*3論が盛んだったときは遠い未来のことだと思っていました。でも、最近の生成AIに触れると、もうそこまでシンギュラリティが来ているとさえ感じます。AIの専門家はもっと解像度が高く見えているはずですが、素人的な立場で『AIが自然に溶け込んでいる未来』が想像しやすくなった。私は新しいものが好きなのでワクワクするし、同時に『これから人間はどうするのだろう?』という疑問も湧きます」
AIの発展とともに巻き起こる議論に「AIが人の仕事を奪う」というものがある。実際、岡島さんも「労働市場に対してのインパクト」を直感している。例えば、Chat GPTは論文の英文校正などで精度がかなり高く「今後は翻訳を校正する業者さんに頼まなくても済む、と言う研究者の方々が身近にもいる」と明かす。
その一方で感じる課題がいくつかある。まずは、自信たっぷりに「間違った答え」を告げること。Chat GPT利用時、多くの人が「あれっ」と思った瞬間があるだろう。「日本語の難しさもあるでしょうが、AIが学習のデータベースとしている情報に偏りを感じます。あるとき電車の乗り換え案内を尋ねたら、JR新宿駅から新幹線が発着することになっていました」。
仕事をバリバリこなす優秀なアシスタントが、唐突に常識外れな回答をしてくる。人間の脳を模したニューラルネットワークの「教師なし学習」で新たな意味を自ら生成するといえど、参照しているネット上の情報が正しいものとは限らない。ユーザーの「分断」が増えそうだとも岡島さんは考える。
「嘘をつく相手から正しい情報を引き出すのは大変なので、使う側にもある程度の知識が必要。原理原則から考えられて、情報の正しさがわかる人じゃないと現段階では使いこなせないだろうと感じます」
![]() |
![]() |
Chat GPTが編み出すのは、膨大なデータセットから妥当性をもとに抽出されたテキストであり、その配列は「意味」を考えて生成されたものではない。そこに意味付けするのは、あくまで人間の側だ。誰にも当てはまる事柄で辻褄合わせした文章には知性を感じず、どうにも薄っぺらい。
岡島さんも手厳しい。「現実にも、そういった『知識のつなぎ合わせ』だけで生きているような人は見かけます。でも、逆に言えば、そういう人物とAIの回答は、ほとんど区別がつかない。だからこそ、社会にインパクトを与えるのかもしれません」。将来、ネット上の情報を代表したAIによる生成テキストが、唯一の「正解」とされる社会*4が来ないのを祈るばかりだ。
一般の利用者が急増するChat GPTは、ユーザーが自分の仕事に関連する作業を試した結果、実用的なレベルで驚いたとの感想が多い。今後、ALEのような宇宙に関する事業を行う会社では、どんな応用が考えられるだろう。
岡島さんは「人工流れ星をこの場所の空で流すと盛り上がりそう」という具合に、ネットの情報を整理してニーズを分析する予測はできるかもしれないと言う。ただ、そこにAIを利用する必要性があるかは不明だとも加えた。まだAIは、リアルタイムで起こっている現実の情報を扱うのに向かないのだろう。
ただ、AI自身がリアルな世界のデータを取りに行き、分析する日も遠くないだろうと岡島さん。「もし、実空間のデータを取り込むAIが出てきたら、私たちの『大気データ』の分析処理で活躍すると思います。防災などにも役立てられそうです」
生成AIが、あらゆる分野で研究者のサポートができることは、数々のユーザーによって実証されつつある。岡島さんは「サイエンスに特化したAIと、生成AIの連携が増える」と見る。一例は、AlphaGo*5で名を馳せたDeepMind(イギリス)の構造解析AI「AlphaFold2」。2022年7月、現在知られているタンパク質の立体構造2億種の予測情報をデータベースとして公開した。同社のデミス・ハサビスCEOは「これはAIによる社会への贈り物だ」とツイッターで述べている。
「このデータベースをもとに、例えば、創薬や環境汚染問題の解決などが進みます。私が面白いと思う使い方は、AIによってサイエンスが発展していく方向です」。深宇宙にも想いを馳せる岡島さん。将来、地球外生命の探査などにもAIの成果が役立てられるかもしれない。
神吉 弘邦(かんき ひろくに)
1998年、慶應義塾大学(SFC)環境情報学部卒業後、日経BP入社。パソコン誌編集部に配属。
その後、文芸出版社での書評誌創刊を経て、2002年から8年間、日英併記のデザイン誌「AXIS」編集部。
2010年よりフリーランス。デザイン誌、建築誌、テクノロジー誌、ビジネス誌、カルチャー誌など、オンラインと紙の両メディアで編集・執筆を行うほか、企業の複数メディアで企画や立ち上げの支援、コピーライティングを担う。
2012年から「TELESCOPE Magazine」に参加。Cross Talk(スペシャルセッション)、Interview(サイエンティスト・エキスパートインタビュー)、Laboratories(研究室紹介)のコーナーに寄稿してきた。
2018年〜2020年、自然と科学をテーマにしたウェブマガジン「NATURE & SCIENCE」(アマナ)編集長。
2021年より経済誌「Forbes JAPAN」コントリビューティング・エディター。