生成AIを2カ月かけて試した企画の前編『ChatGPTにオーケストラの選曲をさせたら「大ゲンカ」になった話』では、ChatGPT、BingAI(マイクロソフト)、Bard(Google)の3者とも、間違いやデタラメやうそが多く、全く参考にならなくて驚いてしまった。後編では、GDP統計に関する調査と展望を生成AIに求めた結果を報告したい。結論から言うと、クラシック音楽の選曲よりは有益な回答が出る。仕事のアシスタントとして役立つ可能性もある。ただし、問題も多いことがわかった。(コラムニスト 坪井賢一)
生成AIは仕事のアシスタントになるか?
経済記事の調査・執筆を手伝わせてみると…
経済統計の新しいデータを入手し、記事・レポート・論文・企画書に反映させる機会は非常に多い。最新情報を確認し、必要な数字を探して入手するのは重要で、とても面倒な作業だ。だれかに手伝ってもらいたいところだが、助手がいるビジネスパーソンはそれほど多くはあるまい。実は、生成AIの登場を聞いたとき、真っ先に「アシスタントになる」と思ったのである。
そこで今回は、経済統計の代表的なものである国民経済計算(GDP統計)を材料にして、生成AIの役立ち度を測ることにした。なお、何を隠そうワタクシ、「週刊ダイヤモンド」
まず、生成AIとは何か、大規模言語モデルであることを理解しておこう。投げかけた設問(プロンプト)に対して、その言葉に続く単語を確率順に並べて、人間が書いたような文章を生成する仕組みだ。設定された条件で文章を継続して生成していく際、文章の意味ではなく、単語出現の確率で文章を生成していくのだから、恐るべきテクノロジーである。
AIが参照する膨大な言語情報は、人力でAIに入力し、学習させたものだ。BingAIとBardはそれぞれマイクロソフトとグーグルそのものなので、言語の継続確率だけではなく、ネットからも情報を収集してくる。
ChatGPTは、繰り返して応答するので、人間が好む回答をするように仕込まれている。文章の意味ではない。応答のテクニックなのだろう。仕込んだのも人間だから、完全ではない。前編で書いたクラシック音楽の選曲で相当イラついたように、うそやデタラメが混じることが多い。要するに、人間が喜ぶように大うそをつく。応答が快適なあまり、間違っていても信じてしまうことがあるので注意が必要だ。
こうした大規模言語モデルの仕組みと3者の違いを理解した上で、今回はGDP統計のピックアップと展望をプロンプトにしてみた。
●あなたは第一級のエコノミストだ
●最新の国民経済計算(GDP統計)から四半期の実質成長率を調べ
●さらに名目成長率や年度成長率も出してください
●また各需要項目の動向と今年度の景気を展望してください
●800字以内でお願いします
簡単な調査と分析だろうと考えた。ChatGPTの回答はこうだった(以下、AIの文章はすべて太字、加筆訂正していない)。