ベストセラー『統計学が最強の学問である』『統計学が最強の学問である[実践編]』の著者・西内 啓氏が、ついに待望の新刊『統計学が最強の学問である[ビジネス編]』を発表。ダイヤモンド・オンラインでは、この『ビジネス編』の一部を特別に無料公開。ビジネスパーソンに必要な「統計力」の磨き方について、ヒントをお伝えします。

ロジスティック回帰の見方の復習

【新刊無料公開】<br />『統計学が最強の学問である[ビジネス編]』第2章 人事のための統計学(7)データの分析結果が出ても、それだけでは意味がない。分析の意味を解釈して、どのような施策を取れば良いかを考えよう

 分析結果が出たらその意味を解釈して、どのような施策を取れば良いかを考えよう。

 本章ではある企業の営業スタッフを対象に、360度評価すなわち上司だけでなく部下や同僚といった関係者からの評価を総合して得られた「上位5%の非常に優秀な社員と考えられるか否か」という指標をアウトカムとした分析を例に話を進める。説明変数の候補としては、基本的な性別と年齢のほか、まず採用時に行なっていたテスト(筆記および面接)成績の履歴を取得し、これ以外に追加で各従業員のビッグファイブの得点を調査した。

 また、社内システムより、接待交際費、旅費交通費や新聞図書費といった科目ごとに経費を何万円使ったかという情報と、1年間にどれだけの休日(全休および半休をそれぞれ何回)を取得したか、という勤怠情報も説明変数として利用できたものとする。

 これらの説明変数に対して変数選択を行ない、その結果得られた分析結果が図表2-9のようなものだったら、あなたはいったいここから何を読み取り、そしてどのようなアクションを取るべきだろうか?

 こちらのロジスティック回帰についても、詳しいことは前著『実践編』を参照していただくとして、少しだけ分析結果の見方だけを説明しておこう。オッズ比とはざっくり言えば、ロジスティック回帰の結果得られる、「該当する確率が(もともと十分小さいときに)おおよそ何倍になると考えられるのか」という結果の指標である。

 たとえば今回例に挙げた分析では「全体の上位5%に該当する優秀者か」というアウトカムを考えたが、これはギリギリ「十分小さい」の範疇だ。この場合、男性のオッズ比が0.96という結果はすなわち、男性スタッフはそれ以外(つまり女性スタッフ)と比べてこの優秀なスタッフである確率が約0.96倍ということになる。すなわち、仮に女性スタッフの5%が優秀だったとすれば、男性スタッフの優秀者割合はその約0.96倍で4.8%ほどだと考えられる。

 なお、もともとの該当する確率が「十分小さい」状況でなければ、この「確率が何倍」という関係がそのまま成り立つわけではないことには注意してほしい。たとえば女性の80%が優秀なスタッフである場合、同じオッズ比から男性の優秀者の割合は約79%と考えられる。本書では初心者向けの読みやすさを重視して以後特に断りなく「オッズが何倍」という意味で「確率が何倍」という表現を用いるが、あくまで(もともとの確率が十分小さいときに)という話だと覚えておいていただけると幸いである。

 ただし、いずれにしてもオッズ比が1より大きい場合には該当しやすく、オッズ比が1より小さい場合には該当しにくく、オッズ比が極端に1より大きかったり小さかったりすればするほど、説明変数とアウトカムの間の関連性は強い、ということに間違いはない。

 また、この性別のように定性的な説明変数については「説明変数が何かに該当する場合、優秀な社員である確率は約何倍に」という見方をする。一方で定量的つまりビッグファイブの得点や使った経費の額といった数の大小で表される説明変数については、これらの数字が「1増えるごとに優秀な社員である確率は約何倍ずつ増える傾向にあるか」という見方をする。

 たとえば感情の安定性に関する得点では、1点増えるごとにオッズ比にして1.08倍ずつ、優秀な社員である確率が増えるという状況である。またこのオッズ比が1を下回る、使った会議費や半休取得回数については、これら説明変数の値が増えるほど、優秀な社員である確率が低いという傾向が見て取れる。

 なお、オッズ比の横に並ぶ95%信頼区間とp値の解釈はそれぞれ前章と同様である。95%信頼区間は、もし無制限にデータを集められたとしたらわかるはずのオッズ比は「だいたいこのへんにあるはずだ」という範囲を示す。この両端がどちらも1より大きいか、逆にどちらも1より小さいとき、p値も0.05より小さくなっているはずで、「ただのバラつきだけで出てきた結果とは考えにくい」と、結果を信頼するのも同様である。

 また、オッズ比がそれぞれ(ほかの説明変数の条件を一定としたとき)というアウトカムとの関連性を示していることも前章と同じだ。なお、表中にオッズ比、95%信頼区間とp値が「‐」と表示されたものは、説明変数の候補としては用意したものの、変数選択の結果統計的に重要ではないため削除された説明変数であることを示す。

「経験や直感に反する結果」はないか?

 これらの結果を上から見ていくと、少なくともこのデータが得られた会社において、男性は女性よりも優秀である確率が低く(つまり女性のほうが優秀)、年齢や入社時に行なった筆記試験と面接の評定の高低は優秀さとあまり関連が見られないようである。

 ビッグファイブの性格特性の中では感情の安定性と誠実性が高い場合に優秀であるという結果が見られた。一方いわゆる人付き合いのうまさと関係しそうな外向性や調和性、経験への開放性といった説明変数については優秀さと関連するという結果は得られなかった。

 また、予算の使い方という点で見ると、会議費をよく使う従業員はあまり優秀でない一方で、新聞図書費をよく使う従業員は優秀という結果が見られた。消耗品費のほか、客先への訪問回数や出張回数およびその移動距離の大小を示すと考えられる旅費交通費、それと接待交際費をいくら使ったかについても、現時点ではプラスともマイナスとも判断がつかない。

 さらに勤怠という観点で、全休を何日取得しているかは優秀さとあまり関連が見られなかったようだが、半休を何回取得したかはかなり大きく優秀さと関連していたようである。

 これらを素直に受け取れば、「女性で感情が安定していて誠実で、会議費は使わず新聞図書費をよく使い、半休を取得しない者がいい営業スタッフ、それ以外の説明変数の関連性は現時点でよくわからない」という結果になるが、こうした結果を読み取るうえでいくつか注意しなければいけない点がある。

 まず何度も指摘してきたように、これはあくまで上司や同僚から「優秀と評価されたか」というアウトカムである。そのため、たとえばこのデータが得られた会社の中で、女性は男性と比べて本当に優秀なのか、それとも女性は男性と比べて優秀と評価されがちなだけなのか、このデータだけでは判断しきることはできない。

 これはほかの説明変数についても同様のことが言えるだろう。半休をよく取るような人間はあまり仕事に熱意がなかったり、前夜のアルコール量を調整する自己管理能力に欠けている(その結果午前中だけ休むことになる)ため、優秀な営業スタッフとなりにくい、という考え方もあるかもしれない。しかし一方で、同じだけの業績を積んでいても半休をよく取る人間は周りからの印象があまり良くない、というだけでもこのような結果は得られるのである。

特に気をつけなければいけないのは、これまでの経験や直感に反する結果が得られた場合である。こうした結果こそが、これまでのやり方を改めて大きな収益に繋がる可能性を持っている一方で、実際のアクションに繋げるまでにありとあらゆる人からの反論に出くわす。だから単純なミスなどでこのような結果が出ていないことを、しっかり確認しておいたほうがいいのである。逆に経験や直感とよく合致する結果は「そりゃそうだ」と言われて終わるだけのものかもしれない。

 具体的には、先ほど「会議費を多く使う者は優秀な従業員である確率が低い」という結果が得られた。飲食を共にしながら顧客やパートナーとコミュニケーションを取る、というのは営業の仕事でも大きなウェイトを占めるが、その回数と相関するであろう使った会議費の大小が業績と負の関連性を示すのだとしたら驚きの結果である。こうしたときには「データを入れ間違ったのではないか?」「何か分析に含めるべき他の説明変数を忘れてないか?」といったことを改めて確認したほうがいいだろう。

 たとえば「優秀かどうか」という採点について、管理職になると業務の性質や他の従業員との関係性からあまり「優秀だ」という高い評価は得られにくい。一方で、個人に紐付いて精算する会議費の額は立場上極端に多くなりがち、という状況は考えられないだろうか?

 だとすれば、データに含まれる管理職たちは、極端に使用する会議費の額が多い一方、それほど評価が高くない、という理由のみによっても、このような結果が得られるかもしれない。この場合、管理職の人員を分析から除外するか、「管理職かどうか」という説明変数を追加して再分析を行なったほうがいい。

 このように考え付く限りのありとあらゆる反論に答えられるような検討を行なった後、それでもなお、経験や直感に反する結果が得られるのであれば、それはおそらくこれまで見落とされていた重大な発見だということになるのだ。
またすでに述べたように、採用時の成績が本当にその後の優秀さと関連しないかどうか、という点についても、それが「切断」や「打ち切り」の影響によるものなのかどうか、注意が必要である。詳しくは章末のコラムで説明しているので、よく確認しておいてほしい。

 とは言うものの、「注意深く慎重に」というだけで結局何のアクションも取れないというのであれば最初から分析などしないほうがマシである。どんな巨大なデータに対する、どんな高度な分析結果であれ、そこからアクションが取れなければ何の価値も生むことはないのだ。

 現時点で収集することができるデータから得られた分析結果はあくまで良いアイディアのタネである。それがもし、業務知識から「明らかにこの理由でおかしい」と言い切れるのであればムリにしがみつくことはない。しかし、間違っているとも言い切れず、かといって正しいとも言い切れない、というのであれば、そのような状況に白黒つけるためにはランダム化比較実験を行なえばいい。

 だから一通りの分析結果を読み解くこの時点では、いろいろ注意すべき点を頭に留めておきつつ、さっさと「分析結果からどのようなアクションが取れるだろうか?」というところへ思考を切り替えていったほうがよい。

取るべきアクション:「変える」

 分析結果から示唆される、取るべきアクションは大きく分けて2つある。1つは「変えること」、もう1つは「ずらすこと」である。

 まず1つめの「変える」ということだが、たとえば感情の安定性が高ければ優秀な従業員になる確率が上昇する、というのであれば、試しに感情の安定性を向上させてみる、というのが取るべきアクションの方向性である。

 感情の安定性とはすなわち、怒ったりイライラしたり落ち込んだりうろたえたりしないということだが、今いる従業員たちの感情の安定性を「変える」ということは不可能というわけではない。たとえば世の中にはアンガーマネジメントと呼ばれる怒りをコントロールするための技術があり、それを学ぶための本やトレーニングするための専門家も存在している。アンガーマネジメントのトレーニングによって、実際に非認知能力を向上させるというランダム化比較実験もすでにある。

 こうしたプログラムによって「感情の安定性」という説明変数を変え、その変化を通して間接的に、今いる従業員をより優秀な者へと変えるというのが1つのやり方である。

 感情の安定性以外にも、たとえば難しい仕事でも最後まで計画的にやり抜くという誠実性を上げるために、前述のセルフコントロールを向上させよう、というのも「変える」アクションである。毎日意識的に姿勢を正しく保ち続ける、とか、常に文法的に正しく丁寧な言葉遣いをし続ける、といったことを心がけるだけで少しずつセルフコントロールの力が増えていく。こうした先行研究もすでにあるのだ。

 また飲食店での会食よりも昼間のオフィスでの商談の回数を意識的に増やす、とか、経費による業務関連書籍の購買を奨励し、読んだ本の内容をチームで共有しあう場を設ける、といった取組みも「変える」アクションとして考えられるかもしれない。こうした「変える」アクションの有効性を検証するためには、従業員をランダムに分ける。そして一方のグループには感情の安定性や誠実性、新聞図書費の使用額といった説明変数を向上させるための研修プログラムを実施し、もう一方のグループには、従来行なわれていたような一般的な研修を実施する。その結果、一定期間がたった後、両者のグループ間でどれほど業績に差が出るかを統計解析してみればよい。もし得られたp値から「グループ間での業績の差異は偶然のバラツキで生じるようなレベルではない」と判断され、かつ、その差が研修などにかかるコストをペイするに十分なのであれば、それは皆さんの会社が、従業員の業績を向上させる方法を発見できたということである。

取るべきアクション:「ずらす」

 ただし、一方で全ての説明変数が、今いる従業員に対して「変えられる」ものではないかもしれない。

 たとえば一番わかりやすい例は性別である。仮に男性より女性のほうが優秀な営業スタッフである確率が高い、という結果が正しくても、だからと言って今いる男性従業員に性転換をさせるわけにはいかない。これは年齢、出身地などありとあらゆる属性についても同様である。これでは「変える」というアクションは機能しない。あるいは先ほどの「新聞図書費の額」という点についても、上司の指示で本を買わせても優秀になるわけではなく、もともと誰に言われなくても自ら会社の経費で本を買うような従業員には優秀な者が多い、というだけの話かもしれない。この場合もやはり「変える」というアクションが機能しないのである。

 このような場合に必要になるのが、もう1つの「ずらす」というアクションである。今いる従業員へ今から変化を与えることは難しくても、今後採用する際の狙いどころをずらすことはできる。すなわち、従来通り何となく経歴と筆記試験と面接で採否を決めるのではなく、明確な狙いを持って、女性や業務に関係する本をよく読む読書家の割合を高めていくのである。つまり、1人1人を変えることはできなくても、会社の従業員全体として、より優秀な者の割合が高い組織へ変えることはできるのである。

 このように採用の狙いをずらしていく場合にも、もちろんランダム化比較実験を行なうことはできる。たとえば人事の採用担当者をランダムに半々に分け、採用プロセス自体を二分するのだ。そして一方のチームは女性や読書家を重点的に採用するよう指示され、もう一方のチームは従来通り採用活動を進める。もちろん前者のチームが男性を採用することもあれば本嫌いを採用することもあるだろうが、一定期間を経た後、どちらのチームによって採用された従業員か、という違いによって偶然とは考えにくいレベルで業績に差がついたのだとすれば、全社的に採用方針を改めたほうがよいということになるだろう。

人的資源管理の施策の候補となる「HPWP」

 最後に、こうした打ち手を考えるうえでもう1つだけエビデンスを紹介しておこう。欧米企業の人的資源管理においてはハイ・パフォーマンス・ワーク・プラクティス(HPWP)と呼ばれるやり方が注目され、また実際にシステマティックレビューによってその有効性が実証されている。

 HPWPは一般に、採用活動、、材選抜、業績評価、昇進、職務設計、社内情報共有、教育訓練、ワークライフバランス管理への従業員の関与、(従業員からの)苦情処理手続き、態度アセスメント、権限委譲、チーム作業、インセンティブ給、といった分野から構成されている。つまり、自社の仕事に適した優秀な人材へどのような方法(たとえば何かの募集媒体を使うのかGoogleのように従業員からの紹介を重視するのかなど)でアプローチし、どのような選抜方法や評価方法を使って本人の能力や適性、モチベーションや現在の仕事ぶりを判断して採用したり、昇進させたりするのか。そして、管理職の経験と勘を超えてどう業務内容やワークライフバランスを設計し、従業員に必要な情報や権限、トレーニングを与え、チームを作り、どのようなスキルの獲得や業績に連動させてボーナスを支払うのか、ということがこのHPWPの考え方である。

 どんな国、地域、業界においてもこうしたHPWPへの取組みを強く行なっている企業ほど業績が良いということがシステマティックレビューの結果示されたのだ。

 簡単に言えば、これらが人的資源管理において有効な施策の候補となるだろう。だが、もちろんいたずらにこれらの施策を推し進めればよいというものではない。特に注意しなければいけないのはインセンティブ給の取扱いである。たとえば1人1人が独立してでき、また成果の質と量それぞれの成果の測定が容易な定型作業においては個人の生産性に対するボーナスはプラスの効果を持つことがある。たとえばアメリカの自動車にガラスを組み込む工場において、時給ではなく成果給(組み込んだガラスの量)によって給料を支払うようにした結果、生産性が上昇しただけでなく、生産性の高い社員の離職率が低下したという事例が存在している。

 一方、チームワークが重要な仕事や、成果の質と量の客観的な測定が難しい仕事においては、ボーナスは個人の業績と連動させないほうがよいかもしれない。チームワークや顧客満足度が重要となっている営業部隊において、単に個人ごとの売上だけをもとにボーナスを出すと、誰も互いのサポートをしないばかりか、顧客のサポートを犠牲にしてまで売上を立てようとし、長期的にはマイナスの影響のほうが大きいということもあり得るのである。

 それよりも、ゲインシェアリングと呼ばれる、企業利益を従業員とシェアする(たとえばあらかじめ決めていた基準に基づき会社があげた利益の何割かを従業員全員で分け合う)仕組みのほうが、企業の状況などによらず従業員のパフォーマンスを向上させる、ということもシステマティックレビューの結果支持されている。皆さんは、ここまで学んできたやり方を使って、自社あるいは自分の部署において業績に貢献しうるのは、果たしてどのような従業員や組織の特性かを知ることができるはずである。このような特性を増やすために、果たして何を変え、また何をずらすのか、という視点を持ったうえで、先ほど述べたHPWPに含まれる施策のうち何が今必要かをぜひ考えていただきたい。

 このように既存データから仮説を抽出し、アクションを考え、実際に検証する、というサイクルを継続的に回すことができれば、皆さんの会社のそれぞれの部署で、適材適所の素晴らしい人材は少しずつ増えていくはずである。