音声認識と音声合成のシステムで
自動応答を行う

 AIコンシェルジュとは、コールセンターや電話業務の自動応答のこと。電話で入ってきた顧客の声をテキスト化し(音声認識)、顧客の問い合わせの意図を解釈して、最適な回答を抽出し(AI対話)、その抽出した回答を文字から音声にして返していく(音声合成)システムだ。

 AIコンシェルジュでは、人での対応が必要な場合、オペレーターに転送することが可能で、音声認識に加えてダイヤルプッシュを併用することもできる。発話内容は音声とテキストで保存され、受付完了メールや問い合わせフォームのURLなどのSMSを送信することもできる。API連携※1などで基幹システム(データベース)との連携も可能となっている。

 活用イメージは大きく四つある。一つは「FAQ対話型」。“ログインできない”“パスワードを忘れた”など、よくある質問に自動で回答する。導入すれば、混雑時の待ち時間の回避、コスト削減、さらにはコア業務への人材集約が実現する。二つ目は「フロー型」。顧客情報や希望内容をヒアリングして、予約や注文をAIが受け付ける。AIなら深夜や休日も対応可能となり、機会損失を防ぐことができる。

 三つ目は「アウトバウンド型」。入金期限や予約前日のリマインドコールをAIが自ら発信する。人手では膨大な時間がかかる作業も、AIならば数倍の効率でコールできる。そして四つ目が「CRM※2」。AIと顧客の会話は全てテキストと音声で履歴として保存されるため、“お客さまの声”として有効に活用できる。

 TACTの強みは、システム導入後の運営(オペレーション)に積極的に関わっていくことによる、音声認識・音声合成の品質の高さにある。

「システム構築が終わった直後のAIは、まだまだ不完全な状態です。運用開始後にユーザーとAIの会話ログをチェックして、AI対話や音声認識におけるエラーを発見し、修正・再学習をしてエラーを解消していきます。人が文字起こしをして機械のテキストとの整合性を図っていく地道な作業が必要なのですが、この“チューニング”を繰り返すことで、徐々に精度を高めていくのです。当社ではこの部分に大変自信を持っており、一連の作業を追加料金なしで請け負っています」(溝辺社長)

 実際に導入した企業からは、音声認識率の高さ(80%以上)や、音声合成の違和感のなさ、導入後のメンテナンス・保守などのサポートの厚さへの評価が高い。それを可能にしているのは、設立以来の主力事業であったコールセンター受託運営事業で、電話業務のノウハウを蓄積してきたからだ。
 例えば、質問に対する適切な回答や、大切なことを伝えるときの“間”の取り方など、具体的な知見とテクニックがAIコンシェルジュに搭載されている。

 また、導入企業へのヒアリングから設計、構築、導入までのスピードが速く、競合相手の大手ベンダーと比べて、初期費用・月額費用が抑えられているのも強みの一つとなっている。

※1「API連携」……Application Programming Interfaceの略。一つのアプリケーションで得た情報をウェブ上に公開し異なるアプリケーションで取り込み共有すること。
※2「CRM」……Customer Relationship Managementの略。顧客関係管理。