データ改竄のワナ

――ところで、現在のように統計学に素養のある人が少ない状態ですと、統計に強い人だけがデータに近づけ、その人が故意にデータを操作しても、他の人にはわからないという状況が出てきますよね。

竹村 そこは非常に危険な話です。近年、複数の製薬会社で統計データの取扱いが問題になりましたが、本来、統計家には「データを改竄しない」などの倫理規定があるんですよ。

西内啓(にしうち・ひろむ) 東京大学医学部卒(生物統計学専攻)。東京大学大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長、ダナファーバー/ハーバードがん研究センター客員研究員を経て、現在はデータを活用する様々なプロジェクトにおいて調査、分析、システム開発および人材育成に従事する。 著書に『統計学が最強の学問である』(ダイヤモンド社)、『1億人のための統計解析』(日経BP社)などがある。

西内 医学研究ですと、データの改竄が起こると人命が損なわれたり、健康保険のお金がムダに使われたりするなど、クリティカルな問題になりかねません。一方、企業サイドからすれば、これまで多額の研究費を費やしてきたのだから、いまになって「統計的な有意差がない」と言われて商品にはなりません、では困るわけです。そこにデータの扱いで不正の起こる素地が生まれるので、昔から「データ固定」という方法が採用されています。

──データ固定?

西内 はい、「データが集まった」という段階で、分析をする前に「もう二度とこのデータを触わらない」という「データ固定の日」を決めます。一度分析して結果がうまく出なかったからといって、データをいじれるようにはできないようにする、ということです。また、ブラインディングといって、どちらのグループが新しい薬を飲んでいるのかは、薬を飲んでいる本人どころか、薬の効果を評価する立場にある医師でさえわからないようにしておきます。このようにデータ固定やブラインディングという手順を徹底し、データが不正に操作されるリスクを減らしています。

 もう一つ、「研究者が片手間に統計解析を行うのではなく、統計解析自体のプロフェッショナルが独立して研究に携わるべきだ」というのが私の恩師・大橋靖雄(日本計量生物学会会長)の考え方です。統計解析のプロフェッショナルは、生涯に一度でも分析で不正を働けば、二度とその仕事をできなくなります。だから不正を働こうとするインセンティブは低いというか、不正に対するペナルティが重い。ところが、薬が生まれた背景にある基礎研究で成果をあげてきた人の場合、統計解析で手心を加えてそれが発覚しても、基礎研究を続けることは許されてしまうかもしれない。とくに医薬研究のような世界では、このような利害をどう調整するかが重要なテーマになっています。

竹村 データの信頼性を確保するためには、西内さんが指摘したような制度設計をしないといけませんね。そこがまだまだできていないと思います。