どんな文章でも3行に要約する
要約AIの「ELYZA DIGEST」
事の始まりは2022年だった。お客様センターでは電話対応後、どのような内容の問い合わせだったか、どのように回答したかを簡潔に記した対応記録を作成するが、次々に新しい入電がある中、数分に及ぶ通話を振り返り、細かな内容を正確に記入するのは困難だった。
そこで音声認識技術を用いて電話内容を文字起こししようと考え、国内音声認識市場シェア1位という高い評価を受けている、アドバンスト・メディア社が開発した音声認識エンジン「AmiVoice」を導入した。
この技術は筆者が普段、使用する文字起こしアプリにも採用されており、ちゃんとした録音環境であれば、かなりの精度で会話を再現可能だが、どうしても一定の誤認識・誤変換が出てしまう。
認識精度の問題は技術の進化や、鉄道向け専門用語エンジンを開発すれば解決できるかもしれないが、それ以上に問題だったのは、会話文を文字化するだけでは読み込まなければ内容を把握できず、データとして使い物にならないことだった。
そこで文字起こしを要約する生成AIを検討する中で、岩崎氏が行き当たったのがELYZAのウェブサイトだった。「三行要約のデモサイトを見て、すごいな、ここまでするということは自信があるんだろうなと思い、連絡したところからの付き合いです」と岩崎氏は振り返る。
三行要約とは、ELYZAが2021年8月に公開した要約AI 「ELYZA DIGEST」のこと。どんな文章でも3行に要約するという機能は当時、SNSでも話題になったことを記憶している。OpenAI社が「ChatGPT」をリリースしたのはその直後、2022年11月のこと。ELYZAは生成AIによる日本語言語処理の先駆的存在だった。
ELYZAは2019年から自社開発の生成AIを、保険会社などのコールセンターに提供していた。最初に着手したのは、三行要約の実績があり、書き言葉で要約しやすいメールの問い合わせだった。続いて電話の要約に取り組もうという時にChat GPTが公開され、通話記録の要約ではGPT-3.5をベースに生成AIを構築することになった。