JavaScriptが無効になっています。
このWebサイトの全ての機能を利用するためにはJavaScriptを有効にする必要があります。
2022年から、「生成AI」が急速に注目を集めている。まるで人間のように答えるチャット、テキストを入力して思いのままに画像を生成するサービス、アバターの登場する動画プレゼンの自動生成、そして複雑なタスクをこなすロボット―――。急速に進化する生成AIは、人間を超えるのだろうか?
生成AIは、入力された情報を元にテキストや画像を「生成」していく。入力文に対して会話するかのようにテキストを出力する自動チャット、説明文に即した画像を生成する画像生成AI、さらには音声や動画、3Dモデルまで、ありとあらゆるタイプのデータを生成するAIが登場しつつある。
生成AIを構成する重要な要素の1つが、大量のデータを学習させて作られた基盤モデル、中でも言語を扱う大規模言語モデルだ。話題のチャットサービスChatGPTなども、大規模言語モデルがベースになっている。Transformerや自己教師あり学習といったディープラーニングの手法が進歩したことで、膨大なテキストデータを効率よく学習したモデルを作ることが可能になった。
従来の(ディープラーニングを用いた)機械翻訳では、翻訳したい文をいったんすべて聞いてから、文全体の意味を表す数値表現に変換。それを元にしつつ、語順を考慮しながら一語ずつ単語を予測して翻訳文を出力するようなイメージだった。この手法では、長文になるほど翻訳精度が劣化するほか、処理を並列化しにくいという欠点があった。
最近の大規模言語モデルの基礎になっているTransformerという手法では、単語を予測する際に、入力元のどの単語に注目するかも考慮する。入力単語それぞれの関係性を事前に学習しておくことで、単語を予測する際の手がかりが増え、予測精度が高くなる。またTransformerは並列計算を行いやすく、プロセッサを増やすほど処理性能が上がっていく。
学習用に収集したテキストデータを、ランダムにマスクして、マスクした部分を当てられるように学習させる。こうした「自己教師あり学習」を用いることで、人間が学習データを用意せずとも、大量のデータを使ったモデルを効率的に作成できる。
大規模言語モデルの能力を表す指標の1つが、パラメータ数だ。人間の脳に例えるなら、神経細胞(ニューロン)同士がどのように結合しているのかを示すのがパラメータ。一般的にパラメータ数が多いほど、複雑で高度な情報処理ができると考えられている。2018年に登場したGPT-1という大規模言語モデルのパラメータは約1.17億個だったが、2020年のGPT-3では1750億個と指数関数的にパラメータ数は増加し続けている(なお、少ないパラメータ数で性能アップを図ろうという動きも進んでおり、必ずしもパラメータ数と性能が比例するわけではない)。
画像系の生成AIを構成する重要な要素が、深層生成モデルと呼ばれる手法だ。さまざまな学習データを元に、画像が生成される過程を推定するモデルを作る。現在、画像生成AIで広く使われる生成モデルが「拡散モデル」。学習用画像データに対してノイズを加え、ノイズが付加された画像を元画像にどうやって戻すのかを学習してモデルを作る。
画像生成AIは、画像とテキストを関連付けて学習した基盤モデルと、画像を生成する拡散モデルで構成される。画像生成AIにテキストを入力すると、テキストと近い意味にある画像の特徴が算出され、その結果を元に拡散モデルが画像を生成する。
現在進んでいる生成AIのトレンドが「マルチモーダル」。複数種類のデータを組み合わせて処理できることを指す。先述したテキストから画像を生成するAIなどもマルチモーダルAIと言える。さらに、Googleが発表した基盤モデル「RT-1」では、言葉でロボットに指示を出して、さまざまなタスクを実行させることもできるようになった。
人工知能が人間の知能を超えるかどうかというのは、古くから議論されてきたテーマである。では、話題になっているさまざまな生成AIは、人間の知能を超えたのだろうか。 もっともらしい回答を返すChatGPTのような生成AIは、関連性の高い概念をそれらしく繋いでいるに過ぎないし、事実と虚構の区別も(まだ)付けることができない。
しかし、それをもって人間の知能は人工知能よりずっと優れていると考えるのは早計だ。生成AIが明らかにしたのは、言語能力や絵を描く能力など、人間ならではの知能と考えられていたものが、思っていたよりも単純な仕組みだったということだろう。私たち人間も、よく知らない事柄を適当に繋げていい加減なことをペラペラ話しているし、フェイクニュースには簡単に騙される。自分が独自に考えたと思ったデザインや文章も、どこかで学んだことから「生成」したパクリかもしれない。そういう意味で、生成AIは「あまりものを考えていない時の人間」には十分匹敵する存在になった。 大規模言語モデルのパラメータ数が増えていったら、人間のような知能が実現されるのかどうかはまだわからない。現在の手法の延長にはない新たなパラダイムが必要になってくる可能性は高い。
それでも、進化し続けるAIはあらゆる分野のテクノロジーを変革していくだろう。遠い未来の話だと思っていた変化がこれからは毎年のように起こり、世界は急速に変わっていく。 もしかしたら、今の人間同士が競い合っている能力差など、AI普及後の世界では取るに足らないものになっているかもしれない。自分の役割がなくなることに脅えて、機械と張り合ったり、無駄な仕事を作ったりするのはますます無意味な行為になる。 AIによってもたらされる巨大な恩恵を私たちはどう分かち合っていくべきなのか、どういう社会のあり方を目指すべきなのか。それを考えてコンセンサスを作っていくことこそ、まさにこれから人間がチャレンジするべき仕事ではないだろうか。
滝澤 恭平(たきざわ きょうへい)
ハビタ代表。編集+ランドスケーププランナー。博士(工学)。水辺デザイン、グリーンインフラ、市民協働などを得意とする。著書に『ハビタ・ランドスケープ』。
山路 達也(やまじ てつや)
三重県出身。雑誌編集者を経て、ブックライター・エディター。テクノロジー、社会問題等をわかりやすく解説する手法に定評がある。構成・執筆協力として、『After GAFA』(小林弘人)、『小飼弾の超訳「お金」理論』(小飼弾)、『不条理な会社人生から自由になる方法』(橘玲)、『生まれが9割の世界をどう生きるか』(安藤寿康)など。