思いついたらすぐ実行できるのは
普段から地道にデータセットを貯めているから

――著者のようにここまで「クレイジー」ではなくても、スマートニュースさんがされているちょっと変わった「実験」というのはありますか?

有力ネットサービスで<br />超バカバカしいことを大マジメにやる理由
西岡悠平(にしおか・ゆうへい)
スマートニュース株式会社 マネージャ データサイエンス・マシンラーニング担当
2003年京都大学大学院情報学研究科複雑系科学コース修了。ネットワーク機器メーカーに入社、2005年上半期の未踏ソフトウエア創造事業「スーパーク リエータ」に認定される。その後、株式会社四次元データWeb技術研究部を経て、2008年に楽天株式会社に入社。レコメンデーションエンジンをはじめとして先端技術の研究開発をリードする。2014年9月にスマートニュースに入社してからは、ニュース配信のチームマネージャーとして、大量のインベントリ(記事の在庫)のなかからユーザーに適したものを配信する作業を担当。

西岡:そういえば、少し前にチャンネルを切り替えるときに出現するページの「裏地」の模様を変えていた時期がありました。クリスマス仕様にキラキラさせたりしてね。私自身はこういう遊び心がとても好きだったんですが……。

西尾:そういえば最近やってないですね。

小田:紙をめくるときの使用感を真似てアプリを作っているので、裏地が見えるのはこだわりのひとつなんですよ。サクサクページがめくれる感じで。

――みなさん好きなのに、どうして最近は「裏地」のこだわりをやっていないんですか? ビジネスで忙しくなってきたから?(笑)

西岡:いえいえ(笑)。裏地はお休み中ですけど、特別なイベントは時々やっていますよ。例えば参院選の時には、トップに得票数をリアルタイムでボックス表示しました。ユーザーの行動分析をすると、その日は頻繁に訪れてくれる方が多かったのでそれなりのインパクトはあったのかなと思います。

――なるほど。熊本の震災の時も、急遽「熊本支援チャンネル」が立ち上がりましたね。

西岡:はい。災害ニュースはもちろんのこと、被害にあわれた方に向けて、避難所ではどういうことに気を付ければいいのか、エコノミー症候群にならないためにはどうすればいいか、どんな支援がどこで行われているのかという具体的な情報記事を表示しました。この時は本当に多くのユーザーがチャンネル登録をしてくださったので、微力ながら支援のお役に立てたのかなと思っているところです。

――こうしたイベントや災害の特別チャンネルをやっていくことは、サービス運営にとって重要なことなのでしょうか。

有力ネットサービスで<br />超バカバカしいことを大マジメにやる理由
西尾亮一(にしお・りょういち)
スマートニュース株式会社 エンジニア/データサイエンス・マシンラーニング
東京大学理学系研究科物理学専攻。Ph.D(素粒子理論)。ポスドクを経験後、スマートニュースに入社。ログ集計基盤と機械学習を活用してユーザーの行動分析を行いながら、スマートニュースの配信記事を決定するアルゴリズムの開発を担当している。

西尾:そうですね。大きな事件や出来事があったときには、きちんと向き合って対応していくことが大切だと思っています。アイデアを思いついたり、今これが必要だと感じたら、<とりあえずやってみる>。このマインドは、著者やデータサイエンティストにも共通かもしれません。

西岡:スマートニュースでは、このデータ分析にはこれくらいのROI(投資利益率)があるからやる/やらないといった制限は、エンジニアに対して一切かけていないんですよ。やりたいならやってみよう、という創業時からの文化が根付いていますから。

西尾:興味を持ったら、持った人がやってみるのが原則ですね。

西岡:施策に落とし込む時には、もちろんROIは意識しますけどね。災害チャンネルや参院選などは数字も大きく上がるので、効果があったのはわかりやすいです。でも、裏地は、数字を分析しても「これだけ優位な差が出た」と短期間で示すことは難しいから……(笑)。

――なるほど。裏地でも災害チャンネルでも「やってみよう」が共通の動機になるのは面白いですね。

西尾:おバカ実験でもマジメなチャンネルでも、思い立ったらすぐ実行に移せるのは、普段から様々なデータ分析を行って、結果を蓄積したデータセットを持っているからこそなんです。データサイエンティストにとって、このデータセットを貯めていくこと自体がとても大変な作業なんですよ。アイデアを思いついたらすぐ役に立てる状態になっていることが大事なので。そうでないと、著者がやったようなばかばかしい実験すら簡単にはできません。

――しっかりしたデータセットの蓄積があるからこそ、「ちょっとやってみよう」がすぐできるということなんですね。

西尾:その通り。CBDも実はものすごく工数がかかっている実験です。さらに、その実験から一般の人たちも面白いと思えるデータと真実を引き出し、おまけに公開してしまうなんてすごすぎます。

有力ネットサービスで<br />超バカバカしいことを大マジメにやる理由
小田秀匡(おだ・ひでまさ)
スマートニュース株式会社 エンジニア/データサイエンス・マシンラーニング
2011年東京大学理学部数学科卒業。2013東京大学大学院数理科学研究科修士課程修了。カブリ数物連携宇宙研究機構(Kavli IPMU)で数学(数理物理学)を専攻。同僚の西尾とは同じ院生室。日本生命保険相互会社を経て現職。日本アクチュアリー会準会員。スマートニュースでは、関連記事のサジェスチョンや、海外の記事の配信国籍判定などを担当。インテリ系エンターテイナー。

小田:我々も著者と同じように、普段から「人間って素直だな」というデータを日々目にしていますが、公開はできませんからね。どの記事をタップするかというのは、他人の目も気にならない行動ですので、本能や直感に従っているのがまる見えです。面白いですよ。

――クレイジーだと思えるデータサイエンティストの行動も、実は普段の地道なデータ蓄積に支えられているんですね。

小田:そう思います。思いついたらとにかくやってみたい、調べてみたい。そして、とりあえずデータを見てみたい。例え無駄だったとしても、失敗したとしても、とにかくやってみたいのがデータサイエンティストの性(さが)だと思います。

西尾:ハーバードの数学科出身で出会いサイトを開発した著者のような人がいたからこそ、僕や小田のような数学を専門的に学んだ人たちがインターネットサービスに携わる道が開けたのかもしれないなとも思います。蓄積したデータセットで、また新たな実験をして発見を繰り返す。それがデータサイエンティストの醍醐味なのかもしれません。