1つの転換となったのは2018年にGoogleが大規模言語モデル「BERT」を発表したこと。そこから数年で特に英語圏ではNLPの最先端技術を実用化したサービスや事例が急速に生まれ始めているという。

日本語では言語特性に依存する技術的な難易度の高さや公開されているデータ量の少なさがネックとなり技術の実用化が遅れていたが、ELYZAではBERT以降の大規模言語モデルと独自の大規模データセットを活用して日本語に特化したAIエンジン「ELYZA Brain」を開発。このエンジンを改良しつつ、”要約”というシーンに特化する形で作ったのが今回の要約AIだ。

現在ELYZA DIGESTは要約後に生成された要約文が成功だったか、失敗だったかをユーザーが判定できる仕様になっている。5日間の集計結果では「失敗」を選んだユーザーが半数以上を占めており、精度の面では改善できる余地がありそうだ。

もっとも今回はデモンストレーション用の小さなモデルを利用しているが、企業向けに提供している大きなサイズのモデルであればより質のよい要約を出力できるケースも出てきているとのこと。ELYZAではすでにSOMPOホールディングスと要約AIを活用した実証実験も初めており、企業ともタッグを組みつつ、精度向上を進めながら社会実装に取り組むという。