大規模言語モデルの
国産開発の先行きは?

 2023年以降、政府はAI開発促進策としてLLM開発プロジェクトへの予算支援に踏み切り、言語生成AI以外のAI開発を行っていた複数の企業が、新たにLLM開発プロジェクトの開始を表明しました。ただし、LLMの構築には潤沢な計算能力が必要です。

 仮に高性能GPUを1000台、20日間借りた場合、その1日あたりの賃料を1万~2万円とすると、構築費用は2億~4億円に達し、しかも再構築の繰り返しは避けられないでしょう。仮に手持ち資金10億円のAIスタートアップがLLM開発に参入した場合、財務的に何が起きるかは想像に難くないでしょう。政府による国産大規模言語モデルの開発支援が、日本のAI開発促進につながったのかどうかは、今後検証が必要です。

 なお、LLMを開発したとしても、ChatGPTやGeminiと同等のものが作れるわけではありません。言語生成AIではウェブ上の文書を学習させてモデルを構築しますが、その段階では説明的な文章など、生成できる文の種類は限られています。

 一方、ChatGPTやGeminiのように会話・要約・翻訳など多様なタスクに対応するには、会話であればやり取りの文例、要約であれば原文と要約文などを追加で学習させる必要があります。ただし、その文例作成はAI技術を活用するとはいえ、大量の人員を動員した作業が不可欠です。

 国産LLM開発プロジェクトの多くは、ウェブ上の文書を学習させた段階にとどまっています。そのため、基本的な文章生成に関するベンチマークで好成績を示しても、多様なタスクへの対応が可能とは限りません。

LLMで勝てないなら
コモディティー化すればいい

 ChatGPTやGeminiに代表される、LLMを利用した言語生成AIは、文章生成精度の高さに加え、汎用性が高い点が特徴です。すなわち、単純な文章作成はもちろん、多様なタスクにも対応できる汎用性を備えており、今後も広く利用されることが予想されます。しかし、前述のように日本はそれを開発・運用するだけの資本力が十分とはいえません。