「人の声」には価値がある
声が届けるむき出しの人間性

(株)Voicy代表取締役CEO。大阪大学基礎工学部卒業後、同大学経済学部を卒業。公認会計士の経験を積んだ後、世界一周の旅に出る。その後、アメリカで会計事務所Ernst&Youngに就職。帰国後は、ベンチャー企業の支援家を経て、2016年に(株)Voicyを創業。Voicyは2022年時点で、年約3000万時間聞かれる、日本最大級の音声プラットフォームとなっている。現在は、「声の力」で人々の生活と社会を変え、新しいワクワクする価値を生むことを目指している。著書に『ボイステック革命 GAFAも狙う新市場争奪戦』(日本経済新聞出版)、『新時代の話す力 君の声を自分らしく生きる武器にする』(ダイヤモンド社)。
緒方 一方で、ゲームや「推し活」の課金額は、世界でダントツです。とくに、モバイルアプリとゲームの1人当たり課金額は16.5ドルと、世界最高です(※)。2位は韓国の10.5ドルですが,これの1.5倍もあります。
※参考:Sensor Tower「Japan Leads Mobile App Spending Per Capita in 2021, Climbing 18% Over 2020 to Nearly $150」(2011.10)
田中 緒方さんは、そこを切り開いていこうと尽力されているのですね。Voicyを知らない読者の方々も多いと思いますので、あらためて、Voicyとは何か、教えていただいてもよろしいでしょうか。
緒方 Voicyは、2016年9月に開設した、「声」によるコンテンツを提供するプラットフォームです。
応募通過率5%前後の審査を通過したさまざまな分野のプロフェッショナルが「パーソナリティ」として、10分程度のショートコンテンツを基本に、自分の声で発信してくださっています。
会員登録者数は200万人、チャンネル数は2000超です。「平均聴取維持率」は80%ほどで、最後までじっくりと聞いてくださるリスナーが多いのが特徴です。
田中 なぜ声に特化したのですか?
緒方 「人の声」には価値があると思っていて、それを伝えたいんです。
いずれAIが進化して、加工されたコンテンツが量産される時代が絶対に来る、そのとき、「人間味」だけが求められるし、商品になると思っていました。その人間味を提供できる最小単位が「声」。何も編集しない声だけをアーカイブして、人間味を届けていく。そこに価値があるはずだと考えました。
田中 AIの時代だからこそ、「人間味」や「編集されない声」に価値があるのですね。
緒方 一番コストが低い発信方法と受信方法なので、不要な加工はそぎ落とされ、人間味だけを届けることができる。今、世の中にあふれているような表面的だけの話は淘汰され、人間味が豊かな人の話を多くの人たちが聞けるようになる。

私たちは、社会を豊かにしたいんです。社会をより良くするためには「教育を変えるべき」とよく言われます。でも私は、「人がどういうマインドセットで生きるか」の方が影響が大きいと思っています。
そのためには、情報の蛇口、つまり、情報発信側を変えていく必要があります。
同時に、情報の受け手も、いろいろな情報を受け取れる受信機を持たなければなりません。つまり、感性を豊かにする必要があります。例えば、あるカップルがけんかしたとしましょう。それで別れることもあれば、「こうしたらうまくいく」と関係を修復できるかもしれない。「もめたままでもいい」という考えだってある。「感性の豊かさ」とはつまり、生きる中で身に付けていく「人生の対処法」なのかもしれません。
魅力的に生きている人や、人間味が豊かな人の話を発信する。それを聞いた人の内面が豊かになり、感性が豊かになる。そうすれば、いずれ社会も豊かになるはずです。
音声メディアに向いているコンテンツ
特徴は「理解」と「共感」
田中 音声メディアに向いているコンテンツには特徴がありますか?
緒方 2タイプあると思っています。
ひとつは「理解」を目的にしたものです。専門家や企業が、ある程度の知識を持つ人たちに向けて届けるコンテンツです。固定のファンがついているパーソナリティが、そのファンに伝えたいことをきちんと届けたい場合につくるコンテンツもそれに当たります。
もうひとつは「共感」を目的にしたものです。パーソナリティが「リスナーの心に深く届けたい」「思いを共感してほしい」、そう考えてつくるコンテンツです。

田中 「理解」と「共感」なんですね。
緒方 すでに海外ではだいぶ前から、著名なアーティストや、ニューヨーク・タイムズの記者が、ファンや読者にきちんと知ってもらいたいことを、音声メディアを通じて発信しています。
そのような流れが、日本でもここ1年でようやく浸透し始めました。意思や思考といった自身の思考を、ファンにじっくりと理解してもらいたい。それには声が適している。そうした認識が広がってきています。
田中 声はダイレクトに伝わりますものね。
緒方 そうなんです。文章で発信すると炎上しやすい。動画は作成に時間がかかります。
YouTubeは一時、とっぴなものや派手なものが多くなりましたが、今では淘汰され、動画で目を引くことにたけた人たちが圧倒的な人気を背景に、ボイスムービーのように声を配信したり、トークを中心としたりしたチャンネルが多くなりましたよね。経緯は違えど、やはり「人間味」のあるコンテンツが残っています。

最大公約数的な正解は、AIがつくったものをそのまま使えばいいと思うんです。でも、例えば、「今日、ランチに何を食べるか」と会話に出たとき、「昨日はカレーだったから、今日もカレーかな」というのは、一見、論理的ではないですよね。
けれども、「昨日はカレーだったから、本当は今日は違うものを食べるべきかもしれない。でも、カレーづいてしまったから、今日もどうしてもカレーが食べたいな」と、まるで論理的でないことを、自分の心情の発露として言う局面もあるかもしれません。そういうときには、きちんと自分で発信する必要が出てくる。