データ統合レベルによるAI成功率の格差

AI活用の成否を分けるデータ統合、医療分野のAI活用には、共通識別子の整備が不可欠

 米Anthropic(アンソロピック)が、危険性の高さを理由に生成AIモデル「Claude Mythos(クロード・ミュトス)」を非公開にすると発表し、世界に衝撃を与えた。とりわけ脅威とされたのが、システムの脆弱性を特定する能力である。人間が見つけられなかった脆弱性を次々と指摘しており、悪用されれば世界中の社会経済活動が混乱に陥りかねない。

 ChatGPTの登場以来、生成AIの進化は目覚ましい。社会はその能力に感嘆する一方で、恐怖を感じている。とはいえ、生成AI活用の可能性やリスク、倫理指針を巡る議論は一巡しつつある。今年からは実証的な使用の段階を超え、社会の奥深くへと浸透し始めている。

 文書作成や検索などの事務支援だけでなく、顧客サービスや基幹業務に至るまで、民間や行政のあらゆる業務活動にAIが組み込まれていけば、今後は導入による成果そのものが求められていくだろう。民間の調査によれば、AIによって売り上げ増加やコスト削減、予測精度の向上といった具体的な成果を実感している企業は全体で25.9%にすぎないという。

 そしてAI活用の成否は、散在する顧客データを一元化するデータ統合と関連している。データ統合を完了した企業では68.9%が成果ありと回答したのに対し、未着手の企業では3.6%にまで落ち込む。その格差は実に19.2倍に上る。データ統合こそが、AI活用の鍵といえる。

 公共分野におけるAI活用への期待が最も大きい領域の一つは医療だろう。しかし、その前提となるデータ統合には心もとない面が残る。政府のワーキンググループでは、この10年以上、医療データの識別子(ID)に何を採用するか結論が出ていない。特に、二次利用ではさまざまなデータ結合が必要だが、その際に共通の識別子がないことは致命的な課題だ。

 国は被保険者番号を実質的な識別子と捉えているようだが、引っ越しや転職などで保険者が変われば番号も変わり、データの連続性は失われる。人手を介した履歴管理にはミスが生じ、データの欠落や他者データとの取り違えも起こり得る。人間が見つけられなかった新たな医療の知見をAIによって発見し、誰もが健康で豊かな人生を送れる社会を築くためにも、医療データの識別子問題には早急に決着をつけるべきだ。

(行政システム顧問 蓼科情報主任研究員 榎並利博)