「安全性の旗手」は看板を下ろしたのか？AI時代、人間が最後に担うべき役割とは

2026年5月29日 12:00

　そして2026年2月9日。Anthropicで安全対策研究チームを率いていたムリナンク・シャルマ氏が、辞任を公表しました。退職時にSNSのXにも投稿された彼の辞任届には「世界は危機に瀕している（The world is in peril）」という一文があります。シャルマ氏が研究していたのは、AIが相手に迎合して誤情報でも肯定してしまう「追従性」の抑制、そしてAIを介した生物兵器の拡散を防ぐ防御策。AI安全性研究の最前線そのものです。彼は辞任届に、「最も重要な価値観を脇に置くよう求める絶え間ない圧力」に直面していたとも書き残しています。

　同じ頃、OpenAIからも離脱が相次ぎました。ChatGPTへの広告導入に反対した研究者、成人向け機能の導入や児童搾取防止策の後退を告発した安全担当者が、会社を去っています。同様に、Xを子会社に持つAI開発企業のxAIでは、共同創設者が相次いで離脱。このうちジミー・バ氏は退職前に「2026年は人類の未来にとって最も重要な年になる」という言葉を残しています。

　2023年、ヒントン博士が独り発した警告は、3年を経て、AI開発の最前線で働く若い研究者たちの間で共通認識となり、その行動に現れています。彼らのそれぞれの決断の背後には、共通する構造が見えてきます。

Anthropicの「安全の旗印」は
なぜ揺らいだのか

　Anthropicを離脱したシャルマ氏が示した「圧力」の正体は約2週間後、組織の公式文書として可視化されました。

　2026年2月24日、Anthropicは「責任あるスケーリング・ポリシー（RSP：Responsible Scaling Policy）」をバージョン3.0に改訂しました。RSPは、AIモデルの能力が一定の危険水準に達した場合、安全性が確保されない限り開発・公開を停止するという、同社設立以来の核心的な誓約です。「旗印」と呼ばれてきた文書でした。

　RSP v3.0では、開発停止のトリガーとなる能力の閾値の定義が、より柔軟に解釈できる表現へと書き換えられました。モデルの安全性評価サイクルも、運用に幅を持たせる形へと緩められています。さらに「国家レベルに相当する最高水準の安全対策は1社だけで担いきれるものではない」として、業界全体の共同行動へ委ねる姿勢に転換しています。

　Anthropicの公式見解は一貫しています。「他社が安全対策を講じずに開発を進めている中でAnthropicだけが立ち止まることは、結果として世界をより危険にする。責任ある開発者こそがフロンティアに留まるべきだ」。この論理には一定の合理性があります。しかしこれは、ヒントン博士が最も強く懸念した「競争に飲まれて企業が自制を失う」構造そのものでもあります。誰よりも自制を掲げてきた企業自身が、その自制を自らの手で緩めた。「TIME」「ガーディアン」「マーケットプレイス」といった英語圏メディアはこの改訂を、同社が掲げてきたAI安全性への誓約を実質的に後退させるものとして批判的に報じています。

Anthropicの「安全の旗印」は なぜ揺らいだのか

Anthropicの「安全の旗印」は
なぜ揺らいだのか