JavaScriptが無効になっています。
このWebサイトの全ての機能を利用するためにはJavaScriptを有効にする必要があります。

Science Report
サイエンス リポート

にわかに注目を集めている「プロンプトエンジニアリング」 ─ AIとの対話技術が成果を決める

文/伊藤 元昭
2025.01.08
にわかに注目を集めている「プロンプトエンジニアリング」 ─ AIとの対話技術が成果を決める

人工知能(AI)が、生活やビジネスの中で当たり前のように利用される時代になった。人間と対話しているかのごとく流暢に言語を操り、目を見張る精緻なイラストや写真・動画を自動生成する生成AIが実用化し、その利用シーンは一層拡大してきている。あらゆる業界・業種のビジネスにおいて、いかにAIを効果的に使いこなすかが、業務成果の質と生産性を大きく左右するようになった(図1)。AIをより効果的かつ効率的に使いこなして望ましい成果を得るため、今にわかに注目を集めている技術がある。「プロンプトエンジニアリング」である。

いかにAIを効果的に使いこなすかが業務成果の質と生産性を大きく左右
[図1]いかにAIを効果的に使いこなすかが業務成果の質と生産性を大きく左右

AIとつきあう近未来処世術「プロンプトエンジニアリング」とは

プロンプトエンジニアリングとは、生成AIなどを活用して、よりよい答えや成果物を得るための方法論である。生成AIやAIベースの情報検索システム、質問応答システムなどを利用する際に役立つ技術だ。

生成AIなどを活用する際に、ユーザーが何らかの指示や命令を入力すると、AIモデルが、その入力の意図や目的を推論し、求める知識やデータ、加工法を探り出し、答えや成果物を生成する。こうした一連の処理の起点となる、ユーザーの指示・命令のことを「プロンプト」と呼ぶ。そして、プロンプトエンジニアリングでは、指示・命令の意図や目的に沿った、より適切かつ高精度、価値ある出力が得られるプロンプトを設計・最適化することを目指す。

プロンプトエンジニアリングが注目される理由

生成AIなどの出力品質は、プロンプトの内容・表現によって大きく変化する。このことは、対話型のChatGPTや画像生成のStable Diffusionなどを一度でも使ったことがある人ならば既に実感していることだろう。入力する指示文(プロンプト)を、ほんのわずか変更しただけで、出力がガラリと変わることを体験しているはずだ。そして、多くのユーザーは、望む出力を出すために試行錯誤するうちに、「どのような指示を入力すれば、望む答えが一発で得られるようになるのだろうか」と考え始める(図2)。こうした悩みを解消するのがプロンプトエンジニアリングの狙いである。

いかにAIを効果的に使いこなすかが業務成果の質と生産性を大きく左右
[図2]思い通りの回答がAIから得られず、プロンプトの書き方に悩むユーザーは多い
写真:AdobeStock

一般に、自分が思い描いている望みを的確に他人に伝えることは思いのほか難しい。例えば、会社内で上司が部下に出す指示においても、どのような目的・意図を持つ指示をいかなる内容・表現で出すかによって、指示された側の作業の質や成果が大きく変ってくる。上司の指示にあいまいさや、意図不明な内容が含まれていたら、指示される側も動きようがない。指示の上手い下手は、管理職の能力の大部分を占める重要なスキルであると言える。こうした点はAIを活用する場合も同様である。もちろん、指示される側のAI自体の能力も出力の質に大きく影響する。しかし、いかに能力のあるAIであっても指示・命令があいまい、不適切であれば、よい回答や成果物を出しようがない。

生活やビジネスの中でAIと共に業務や作業をするようになった現在、すべての人がAIの上司の立場に立つようになったと言えよう。AIが普及することで、人間の活躍の場が減り業務の成果が画一化されると見る人がいる。しかし、実際には、AIの使いこなしの巧拙次第で活用の成果が大きく変わる。これから私たちが生活や仕事の中で磨いていくべきスキルは、AIのよき上司になるためのスキル、要するにプロンプトエンジニアリングになりそうだ。

プロンプトの内容・表現を工夫することで実現すること

AIユーザーがプロンプトを適切に設計できるスキルを身につければ、以下のような効果が得られる。

まず、AIの潜在能力を最大限まで引き出し、質と精度の高い回答やイメージ通りの成果物が得やすくなる。すると、AIシステム自体は同じものを使ったとしても、使い手のスキルが高まることで、それまでAIに任せるのを諦めていた業務にもAIを適用できるようになる可能性がある。

また、AIから求めている成果物を得るまでに要する労力、時間、コストを削減できる。一般にAIユーザーは、想定した目的や基準に適合し、イメージに沿った成果物が得られるまで、レビューとプロンプトの改良を繰り返し試行錯誤する。場合によっては、AIの出力を人手で修正・補強する後処理を行うこともある。このように従来のAI利用では余分な労力が生じ、思わぬ非効率に陥りがちだった。しかし、方法論が体系化されたプロンプトエンジニアリングを適用すれば、AI活用に付随する余分な手間が不要になる可能性がある。

加えて、プロンプトエンジニアリングを実践することで、AIモデルの汎用性や抽象度を高めて、より価値ある成果物を生み出せるようにもなる。AIの活用とは、ユーザーとAIの共同作業と言い換えることができる。そして、特定業務での質や精度の高い成果をAIだけで得ようとすれば、AIを専用化させる必要が出てくる。ユーザー側でプロンプトを工夫し、特定業務に特化した成果物を得るためのコントロールを行えば、その分AIモデルの汎用性と抽象度を高めることができる。すると、より幅広い知識や多様な技能を持つ汎用性・抽象度の高いAIモデルを利用できることになり、よりよい成果物が得られる可能性が高まる。さらに、同じAIモデルを多様な業務を担う部署・担当者間で共有することも可能になる。

質と精度の高い回答を得るためにプロンプトに盛り込むべき4つの要素

ここからは、プロンプトエンジニアリングでは具体的にどのような視点・手法を使ってプロンプトを最適設計していくのか紹介する。

プロンプトエンジニアリングを実践する際の起点として、以下の4つの要素に注目し、より明確で適切なプロンプトを設計していくことが推奨されている(図3)。すなわち「指示・命令」「文脈・背景」「入力データ」「出力形式」の4つである。

プロンプトに盛り込むべき4つの要素
[図3]プロンプトに盛り込むべき4つの要素
作成:伊藤元昭

指示・命令とは、AIに実行してもらいたい作業の内容である。「○○とは何か教えて」「○○を要約して」「○○を紹介して」など、AIに行ってほしい作業を伝える部分だ。基本的にAIは、指示・命令さえあれば何らかの答えは出力するため、この部分がプロンプトの中心であると言える。質や精度の高い回答を得るためには、求める作業内容が多すぎず、あいまいさを極力排除した明確な命令・指示を出すことが重要になる。

文脈・背景とは、回答を生成する際に参考にしてほしい追加情報のこと。AIが推論する際の対象領域に制限や条件を加え、ユーザーの目的や意図に合った回答を得るために必要な情報である。ここでは、不要な背景情報や矛盾を含んだ内容がないことに注意する必要がある。

入力データとは、出力の中に盛り込んでほしいデータや情報のことである。例えば、回答に盛り込む固有名詞や文章を要約する際の要約元のテキスト、調査方法などを伝える。出力内容に、条件や制限を加えるために付記する情報である。ここでは、AIが理解しやすいようにデータを整理し、例示にミスや誤りがないことが重要になる。

出力形式とは、回答の形式を指定するための要素である。箇条書きや文字数制限、グラフ化などを指定して、意図や成果物の利用シーンに合った出力を得るために付記する情報だ。ここでは、条件や制限の数が多すぎることがないようにして、具体的に指示できていることが重要になる。

プロンプトエンジニアリングでは、これら4つの要素を盛り込みながら、望ましい出力を得るために、プロンプトを設計・最適化していく。各要素は、明確かつ具体的、簡潔に表現することが重要である点は、あらゆるケースに共通している。ただし、設計法自体にはあらゆるケースに適用できる決定版となる方法があるわけではない。人間の間でコミュニケーションする場合、対話する相手によって会話の内容や表現が変わる。同様に、プロンプトエンジニアリングにおいても、利用するAIモデルごと、AIを活用するシーンごとに適したプロンプト設計の方法論がある。このため、まずは、最初はシンプルな指示・命令から始めて、試行錯誤しながら、利用するAIの特徴を利用者目線で把握・理解し、4つの要素ごとにプロンプトの改善点を見つけ出して、最適な設計法を探ることになる。

人材教育と同様に、AIでも例示と模範の提示は効果的

効果的なプロンプトを設計するために、さまざまな手法が提案されている。基本的にAIは、無垢で何事もまっすぐ受け止める子どものような存在である。提案されているプロンプト設計の方法論は、正しくしつけるように言い含めるための教育の手法に似ている。特に、単に指示・命令を出すだけではなく、指示と回答の例を巧妙に提示することで回答の質を高めていく方法が多い。いくつか紹介する。

最も単純なプロンプト手法

最も単純なプロンプトの作成法は、「Zero-shotプロンプティング」と呼ばれている。例示なしでAIに作業を行わせるものだ。この方法は手軽ではあるが、作業の難易度やAIモデルの性能によっては、出力の質が低くなる傾向がある。

いくつかの質問と回答の例を与えてから、AIに問いたい質問を投げかける方針に基づくプロンプト設計法が「Few-shotプロンプティング」である。基本的に、Zero-shotプロンプティングでは、満足な回答を得られなかったケースなどで利用する。一般に、質問と回答の例を増やせば増やすほど、回答の精度が高まる傾向がある。

回答を推論する過程も例示する手法

質問と回答だけでなく、回答を推論する際の過程も同時に例示する手法もある。「Chain-of-Thought(CoT)プロンプティング」と呼ばれる手法だ。人材育成の有名な格言に「やって見せ、言って聞かせて、させてみて、褒めてやらねば人は動かじ」というものがあるが、同じアプローチである。CoTは、人間の思考プロセスに似た方法で、問題を段階的に解いていく方法である。推論過程の模範をユーザーが示しているため、単純な質問では回答が得にくい複雑な問題への対応が可能になるとともに、AIの思考過程を理解しやすい点も特徴である。

フレームワークを活用しAIに推論させ質の高い回答を得る手法

質問の回答に対しての問題理解を深めるためのフレームワークを示し、AIに推論させることで質の高い回答を得る方法もある。「ReAct(Reason and Action)プロンプティング」と呼ばれる手法が該当する。初期の推論結果であるThought(思考)、思考に基づいて取るべき具体的なAction(行動)、行動した結果得られた情報や洞察Observation(観察)の三段階を繰り返して、満足できる最終回答を得る。課題解決に向けた戦略の策定などで効果を発揮する方法である。

その他さまざまな手法がある

さらに複雑な手順を指定して、巧妙に段階を踏みながら推論を進め、回答の質や精度を高める方法もある。CoTと同様のアプローチで類似した複数例を示し、AIに複数の回答を生成させて回答を集計・評価して最終回答を得る「Self-Consistency(自己整合性)プロンプティング」や、解決したい問題に関連する知識をAIに生成させるプロンプトを一度入力し、AIが生成した知識を含むプロンプトを作成して最終的な回答を得る「Generate Knowledge(知識生成)プロンプティング」、ヒントを出して回答に一定の方向性を付与する「Directional Stimulus(方向性刺激)プロンプティング」などがある。これらの他にも多様な方法が提案されている。

質の高い回答を得るための方法論が高度化してく中で、AIを悪用するためのプロンプトの設計手法も出てきている。通常、AIの思考過程はブラックボックス化されており、サービス提供者が悪用されないように制限している場合がほとんどである。ところが、巧妙にAIの思考を誘導するプロンプトを入力することで、本来ならば伺い知れないはずの学習データを抜き出したり、制限されているはずの回答を出したりできるようになる。AIを対象にしたサイバー攻撃の一種である。こうした悪意を含んだプロンプトを「敵対的プロンプト(Adversarial Prompting)」と呼ぶ。一般に、敵対的プロンプトの使用はAIサービスの規約違反になる。

プロンプト設計の重点は、近い将来「How」から「What」へ

AI関連の技術は、日進月歩で進化している。活用する対象の機能・性能・特性が大きく変わっているのだから、プロンプトエンジニアリングもまた進化し続けていくことになる。利用する最新AIの特性を生かしたプロンプトエンジニアリングの実践が求められる。

注目されるAIの進化の方向性として、マルチモーダル化がある。これまでは、テキスト情報だけのプロンプトを入力してAIに回答を求めることが多かった。これが、テキストに加えて、画像、動画、センシングデータなど多様なデータをプロンプトに盛り込んで、より質の高い回答が得られる方向へと進化しつつある。これによってAIが、顧客の声のトーンや顔色、場の空気を読みながら要望に応える有能な小売店販売員のような気の利いた受け答えができるようになる可能性がある。

また、早くもプロンプトエンジニアリング自体にAIを導入して、自動化する動きも出てきている。これによって、プロンプト設計の質が大幅に向上し、AI活用に熟練していないユーザーでも効果的にAIを使うこなすことができるようになる可能性が出てきている。

近い将来、プロンプト設計の重点は「How」から「What」へ移行
[図4]近い将来、プロンプト設計の重点は「How」から「What」へ移行
作成:伊藤元昭

では、そうしたプロンプトエンジニアリングの自動化が進めば、プロンプト設計のスキルは、まったく不要になるかと言えば、そうではない。現在のプロンプトエンジニアリングでは、よりよい問題解決に向けて、AIにどのような指示・命令を出すべきか、「How」を工夫する点に重点が置かれている。これが近い将来、解くべき問題の設定、「What」に重点を置いたプロンプト設計が重要になってくる可能性が高い(図4)。問題が適切に設定されていなければ、どれほど洗練された表現を駆使したプロンプトであっても十分な効果が得られない。

Whatを定義する問題設定とHowに重点を置いた現在のプロンプトエンジニアリングでは、焦点、主要タスク、基盤となる能力が異なる。問題設定では、問題の焦点、範囲、境界線を正確に説明することが求められる。一方、現在のプロンプトエンジニアリングでは、語彙、フレーズ、構文、句読点などの符号を適切に選び、最適なテキスト入力を作成することに焦点を当てられている。

仮に、問題設定の領域自体が自動化する時代が到来したらどうなるのだろうか。それは、AI自身がAIを使いこなし、解くべき問題を自律的に発見・解決するシンギュラリティが到来したことを指す。

Writer

伊藤 元昭(いとう もとあき)

株式会社エンライト 代表

富士通の技術者として3年間の半導体開発、日経マイクロデバイスや日経エレクトロニクス、日経BP半導体リサーチなどの記者・デスク・編集長として12年間のジャーナリスト活動、日経BP社と三菱商事の合弁シンクタンクであるテクノアソシエーツのコンサルタントとして6年間のメーカー事業支援活動、日経BP社 技術情報グループの広告部門の広告プロデューサとして4年間のマーケティング支援活動を経験。

2014年に独立して株式会社エンライトを設立した。同社では、技術の価値を、狙った相手に、的確に伝えるための方法を考え、実践する技術マーケティングに特化した支援サービスを、技術系企業を中心に提供している。

URL: http://www.enlight-inc.co.jp/

あわせて読みたい

Science Report

新着記事

よく読まれている記事

Loading...
Loading...