言葉がリアルタイムでテキストになる時代は、すでに到来している。iFLYTEKの独自開発技術を集結したAIライティングレコーダーの実力

精度の高い文字起こしを実現する「VOITER」と「VOITER mini」

 まずは、重要な会議の記録やインタビューなど、プロユースを想定したハイエンドモデルの「VOITER」について見てみよう。

「従来のICレコーダーでは集音距離は1m程度のものが多いですが、『VOITER』は二つの指向性マイクと360度から集音できる六つの無指向性マイクが搭載されていて、より遠距離でも録音できます。録音モードも「会議/講演/取材/標準/メモ/音楽」の六つのモードから選択できるだけでなく、話し手の方向を特定して、不要な雑音を自動的に判断・除去できるため、複数人が集まる環境での使用にも対応が可能です。タッチパネルで手軽に操作できるので、スマートフォンと同じような感覚ですぐにお使いいただけます」(孫氏)

取材当日の音声もクリアに再現した「VOITER」。なかなかの実力だ

 実際に手に取ってみると、スマートフォンに近いサイズで、通常のICレコーダーに比べると少々大きいが、Wi-Fi接続時には操作画面上でほぼリアルタイムに文字起こしができるだけでなく、一度間違えた言葉もAIが文脈を判断して自動修正してくれるため、予想していた以上に精度の高い文字起こしが実現できていることが、瞬時に見て取れた。

 さらに「VOITER」には、800万画素のカメラが搭載され、Wi-Fiなどのネットワーク接続時には動画を撮影しながらリアルタイムで字幕表示が可能(録画は縦向き表示のみに対応)。打ち合せなどの状況を画像として記録することもできるため、議事録や資料作成に有効であると考えられる。

 録音、録画ともに、オフラインでも使用することができ、USBケーブルを使用してPCにエクスポートすることが可能だ。またテキストデータは、Wi-Fiなどのネットワークに接続して操作画面からメール共有やクラウドスペース「RECORDER STATION」へアップロードした後、編集・共有・ダウンロードなどデータ管理することが容易だ。

 一方、「VOITER mini」は、わずか約55mm×32mm×15mmと、指先でつまめるほどの、非常にコンパクトなサイズ。カセットテープをモチーフにしたレトロなデザインで、持ち運ぶのには最適だが、「ここにも当社の高度な音声認識技術を集結させています」(孫氏)。

「VOITER mini」。スマートフォンの専用アプリと連動させるとリアルタイムでの文字起こしも可能

  プロユースの「VOITER」と違ってマイクの数は二つのみだが、操作しやすく360度からの集音が可能で、32GB搭載の大容量。Bluetoothでスマートフォンの専用アプリ「VOITER notes」と連携させることで、アプリ上でリアルタイムに文字起こしできる。それだけでなく、編集・ダウンロード・メール共有も「VOITER」と同じようにでき、なんと録音後に話し手ごとにテキストを分離できる話者分離機能まで付いている。

「VOITER mini」の話者分離画面。スピーカー1、スピーカー2と、話し手の声を自動で分離してくれる ※2021年12月現在、リアルタイム文字起こし時の話者分離は不可。アップロード・文字起こし処理後、話者分離が可能となる

 クラウドを使用して文字起こしを行うという機能上、気になるのはセキュリティーだ。その問いに対しても孫氏は自信を見せる。

 重要な会議や取材では機密情報を扱うことも多いため漏えいリスクが懸念されるが、「われわれは日本の企業やコンシューマーがセキュリティーを何より重視していることを認識しています。安心してお使いいただけるように、音声やテキストなどのデータは、国際的なセキュリティー基準の規格を満たした日本国内のサーバーで厳密に管理するなど、セキュリティー対策もしております」。

問い合わせ先

キヤノンマーケティングジャパン株式会社
〒108-8011
東京都港区港南2-16-6
キヤノン Sタワー
ai-toiawase@canon-mj.co.jp

製品に関する問い合わせ

iFLYTEK JAPAN AI SOLUTIONS株式会社
〒104-0031
東京都中央区京橋 2-12-9
ACN京橋ビル 7F
E-mail:marketing@iflytek.co.jp

TOP