平均年収、平均年齢……プレゼンやデータで当たり前に使われる「平均」という言葉。でも、そもそも平均ってなんだろう。同じデータからさまざまな平均値が生まれる“操作”とは? 「ビジネス数学」の第一人者・深沢真太郎氏の新刊『 数字にだまされない本 』(日経ビジネス人文庫)から一部抜粋してお届けする。
往路は時速20㎞、復路5㎞。平均時速は?
まずは、とても簡単な算数・数学のお話。少しだけおつき合いください。
100kmの距離を往路は時速20kmで走り、復路は時速5kmで走った。
往復での平均の速さは?
一般的な算数の正解はこうです。
往路でかかった時間:100÷20=5(時間)
復路でかかった時間:100÷5=20(時間)
往復で200kmの距離を25時間かけて進んだので、平均の速さは200÷25=8
時速8km
しかし、この問題を(20+5)÷2=12.5と答える方もいます。
時速20kmと時速5kmという2つの数字のまさに平均値を計算したのでしょう。
気持ちはよく分かりますし、これを間違いとしてしまうのは少しかわいそうな気もします。
私の個人的な解釈ですが、もしこの問題が「往路の速度と復路の速度の平均は?」であればその考え方で正解となるでしょう。
簡単な算数を体験していただきましたが、この問題を通じてあなたにお伝えしたいのは、平均にも定義が必要なときがあるということです。
データを“操作”するテクニック
例えばある企業が従業員に対して、職場の満足度について5段階(最高が5、最低が1)で評価してもらったとします。対象者は計8人。
当然ですが、正直に評価することを前提とします。
またこの調査において平均が3.5を下回る場合は「問題あり」と評価することが決まっているとします。
実際に調査した結果、8人の平均スコアは図1のように3.5。
ちょうど基準値ですから、現状は問題ないと評価するのが妥当でしょう。
しかし、あなたがこの調査データを使ってどうしても「問題あり」という結論にしたい立場だとします。
例えば金子さんのように現状の環境に不満を持っている人であれば、職場環境を変えてもらえるようにこの情報を“操作”したいと思っても不思議ではありません。
だからといって、実際のスコアを勝手に変えるとデータの改竄(かいざん)になります。
では、このようなデータをどのように“操作”することで、「問題あり」という結論をつくることができるでしょうか。
変えたのは「定義」だけ
例えばこのデータを男性と女性で分解してみます。
すると男性の平均は「4」、女性の平均は「2」となります。
この2つのスコアの平均を「従業員の平均」と定義すれば、その数字は「3」。
基準値である3.5を下回っており、「問題あり」という結論をつくることができます。
「まるでペテンじゃないか」と思う方もいるでしょう。
しかしここで重要なのは、この“操作”はウソをついているわけではないということです。
ある人物の満足度が「5」なのに、それを勝手に「3」にしたわけではありません。
平均という数字にその人なりの定義をし、その通りに正しく計算しただけです。
さまざまな「平均」が生み出せる
ここから導かれるのは、あなたの日常生活においても、相手はあなたが思っている「平均」とは違う「平均」を使って説明している可能性がゼロではないということです。
私たちが日常でよく使う平均値という数字すらも、その定義を確認する必要があります。
とはいえ、情報発信者がその平均値の算出法まで丁寧に説明するような良心的なケースはほとんどないのが現実です。
そのため、私は統計データを読むときや誰かのプレゼンテーションを聞くときなどに平均値が登場したら、可能な状況であればその定義を確かめるようにしています。
いくつか具体的な例を紹介しましょう。
「定義」を確認する3つの質問
- ●従業員の平均年収
- →「それは従業員1人当たりの年収という意味でよろしいでしょうか。
- 具体的には、(全従業員の年収を合計したもの)÷(従業員数)と理解しています」
- ●平均商品単価
- →「それは全商品が対象でしょうか。それとも売れた商品のみが対象でしょうか。
- また、100円の商品が4個と200円の商品が1個の場合は、600円を5で割って120円とするのか、それとも100円と200円の平均で150円と考えるのでしょうか」
- ●平均従業員数
- →「それは全従業員数を事業所の数で割り算した結果でしょうか。
- あるいは各事業所の平均従業員数のさらに平均をとった値のことでしょうか。
- あるいは過去数年間、年ごとに算出した全従業員数の平均でしょうか。
- そもそも、従業員の定義は何でしょうか。兼務役員、派遣社員やアルバイトのスタッフは含まれるのでしょうか」
特に最後の平均従業員数に対する定義の確認などは、ここまで紹介してきた内容のエッセンスが盛り込まれている例ではないでしょうか。
だまされないためには常に「確認」
単に平均従業員数とだけ表現されても、具体的にどんな数字を使い、どんな定義で平均値としたのか分からなければその数字の本当の意味も分かりません。
単純に全従業員数を事業所の数で割り算した結果なのか、先ほどの従業員満足度の事例のような少しばかり個性的な定義をしたのか、あるいは時系列データのある範囲での平均なのか。
そもそもどこまでの範囲を従業員としたのか。
ここまで確認できれば、その平均という数字にあなたがだまされることはありません。
ひと口に「平均」といっても、実にさまざまな「平均」があります。ぜひ確かめる習慣をつけてください。
定義の重要性。
十分すぎるほどご理解いただけたでしょう。
【ポイント】
「平均」はウソをつかずにメッセージを操作できる数字。
平均の定義から確かめる習慣を
『 数字にだまされない本 』
うまい数字には嘘(ワナ)がある!
売り上げ目標、前年比、平均年収、レビューの評価点、視聴率、感染者数の推移……私たちは数字に囲まれて生きています。でも、その数字は本当に信じていいもの?
ビジネス数学教育家として人気の著者が、「数字を正しく読む技術」をエクササイズや事例を交えて解説します。
深沢真太郎著/日本経済新聞出版/定価880円(税込み)