人工知能(AI)をますます強力なものにしようとしのぎを削る企業にとって、新たな問題が浮上している。それは、インターネットの世界は小さすぎるかもしれないということだ。米オープンAIや米アルファベット傘下のグーグルなどが開発する強力なAIシステムの学習に必要な情報の量は増え続けている。こうした需要が高まる一方で、オンライン上の質の高い公開データは限定されており、データ所有者の間ではAI企業による利用を防ごうとする動きもある。一部の企業幹部や研究者は、質の高いテキストデータに対する業界の需要は2年以内に供給を上回り、AIの発展を遅らせる可能性があると指摘する。AI企業は未開拓の情報の供給源を探しており、AIシステムの訓練方法を見直す動きもある。チャットボット(自動会話プログラム)「チャットGPT」を開発したオープンAIは次世代モデル「GPT-5」の訓練で、動画投稿サイトYouTube(ユーチューブ)の公開動画のトランスクリプト(文字起こしデータ)を使うことを検討していると関係者は語る。
生成AI企業にネットは小さすぎか 学習データ不足に懸念
オープンAIなどでは、次世代AIモデルの訓練に必要な十分な量のデータの確保が新たな問題に
有料会員限定
あなたにおすすめ