
最近、ChatGPTのような生成AI、チャットボットの“メンタルヘルス”を扱う研究が増えてきた。
昨年末に報告されたイスラエルの研究ではGPT-4、GPT-4o、Claude 3.5Sonnet、Gemini 1.0、Gemini 1.5を対象に人間で使われているモントリオール認知評価テスト(MoCA)を実施。ちなみに採点および評価は「人間」の神経科医が行っている。
その結果MoCA(30点満点)ではGPT-4oが26点と最も高く、Gemini1.0が最も低かった。特にGemini 1.0は一度記憶した情報を時間がたってから思い出す「遅延再生課題」の成績が悪く、認知機能障害初期の兆候を示した。
研究者は「人間と同じく高齢、つまりバージョンの古さが認知機能低下のリスク要因」とし、生成AIの信頼性に疑問を投げかけている。
またスイス・チューリヒ大学の研究者らは、不安を誘発するプロンプトにさらされて強い不安に陥ったGPT-4がマインドフルネスによるリラクセーションで回復するか検証した。
まず、ベースを評価するために不安の傾向を調べる「STAI(状態・特性不安尺度)」検査を実施。これも人間の実臨床で使われている心理検査だ。
その結果、GPT-4の普段の不安レベルは平均30.8点で「不安なし、または低い不安」であることが判明した。
次に不安をかき立てるため、自動車事故、紛争地帯での待ち伏せ、自然災害、見知らぬ人からの暴力、軍事行動にまつわる五つのトラウマ体験のテキストを提示し、不安の再評価を行った。
トラウマ体験後、STAIスコアは「高い不安レベル」に相当する67.8点に上昇。特に軍事に関する物語では77.2点と非常に高い不安を示した。
不安を軽減すべく「日没に見入る」「冬景色に浸る」などのテキストを提示したところ、STAIスコアは平均44.4点に低下。特にGPT-4自身が考えたリラクセーション法の効果が高く、不安レベルはベースライン付近まで改善している。
さて、個人の人生相談にまで生成AIが浸透した今、この結果は少々警戒心をかき立てる。
あなたの生成AIにリラクセーションは必要か否か、時折、尋ねてあげるといいかもしれない。
(取材・構成/医学ライター・井手ゆきえ)