近年、色々なメディアで糖に関しての科学的知見について見聞きする機会が多くなっています。糖はヒトにとって必須なエネルギー源なのできちんと正しく摂取しなければいけない反面、もちろん取り過ぎてしまうのも良くないのは事実です。このバランスを理解するためには統計学の知識が必要になります。今回は統計学について考えていきましょう。
統計学がなぜ大事なのか??
今回のコロナ禍では色々な情報が錯綜し、それによって一般の方だけではなく、マスコミ関係者や政治家たちも情報に振り回されている雰囲気があります。統計学をきちんと理解している者があまりにも少ないという現実からきているように思います。糖に関する健康情報も世の中にはたくさん存在しており、それらを正しく理解するためには統計学が必須です。よく「統計学は最強の学問」と言われますが、まさにその通りです。他の数学的知識は理解していなくても、一般の方が生活に困ることはあまりないかもしれませんが、統計学を理解していないと、日常の大切な情報を正しく理解することができないのが事実です。つまり、皆さんが日常で目にするデータは必ず何らかの統計学的手法を介しているということです。
統計学がない世界を想像してみると??
統計学がない世界ではどのようなことが起こるのでしょうか。例えば、ある小学校でお菓子を食べて頭が良くなるか、という実験を3つのクラス(A、B、C)で行ったとします。それぞれのクラスには10人の生徒がいます。Aクラスでは、10人とも10点でした。Bクラスでは、10人中50点が2名、あとの8名は0点でした。Cクラスでは100点が1名いたものの、残りの9人が0点でした。どのクラスも平均点は10点ということになります。さて、平均点がどのクラスも同じだから同じ効果が出たと言えるでしょうか。どうみても点数的にはかなりのばらつきがあり、大きな問題になりますよね。統計学がないとこんなことになりかねません。全く同じ人が存在しないこの世の中では、ばらつきは絶対に出てきます。こういうばらつきを正しく評価するのが統計学の大事な役割なのです。
統計学の基礎を理解しよう!!
前述したように平均値は有名な言葉で、一般の方もよくご存知かと思います。平均値と聞くと、データの真ん中を表していると思いがちですが、実はちょっとばかり違います。例えば、前述の小学校の10人の点数の場合で考えると、0点、1点、2点、3点、4点、16点、17点、18点、19点、20点のような場合だと、平均点の10点は確かにデータの真ん中を表しているとは言えますが、前述したようにばらついている場合には、平均点の10点は真ん中とは言いがたいです。統計学的に本当の真ん中を表す指標として、中央値というのがあります。前述した小学校の場合だと、真ん中の4点と16点を足し2で割った値の10点が中央値となります。確かに平均値と一致しています。データのばらつき具合がよくわからない場合が多いので、統計学の世界では、この中央値が大事になります。そして、ばらつきを表す指標として、分散があります。この分散は、平均値と各データとの距離を二乗して足した後に、データ数で割ったものになります。言わば、平均値と各データの距離の平均とも理解できます。そしてこれにルートを取ったものが標準偏差になります。ちなみに、ばらつきのことは分布と言います。ばらつきがきれいな分布を正規分布と言います。統計学で大事なのは、このばらつきがない正規分布に自分のデータを極力近づけるということです。そのためにはデータ数を多く取ると良いです。なるべく大量のデータを取るようにサンプリングをがんばるのはこのためです。正規分布になると平均値が真ん中として信頼できるものになるという利点もあります。
統計学は2種類ある?!
統計学は実は2種類あります。データに統計学的手法を用いて、そのデータの集団の特性を見つける統計学的手法のことを「記述統計学」と言います。一方、データの集団の特性を見いだすだけでなく、その集団の特性から、そのデータを取ってきた元の集団(母集団)の特性を推定・検定することで予測することを「推測統計学」と言います。本来、データ全部を調べることができる記述統計学が望ましいのですが、なかなかそうはいかないということが多いです。例えば、日本人全員を調べるのは絶対無理です。その際には、日本人からランダムに多数の人を選んできて、その人たちを調べた後に、日本人全体の傾向としてみなす、という推測統計学を使います。
統計学は万能ではない??
もともと統計学は確率と関係しています。確率を解析するとある傾向が見え、その傾向を解析するのが統計学です。つまり統計学は万能ではなく、絶対にそうであるという訳ではないことに注意が必要です。例えば、薬の効果も統計学に基づいたものですが、みんなに効く訳ではなく、副作用が起きる人もいます。また、最近話題の人工知能も統計学的手法の1つである回帰分析が基になっていますが、過去の傾向から未来を予測するだけで、過去と違うことが起こる場合には限界があります。つまり、「統計学は最強であっても万能ではない」ということです。
ぜひご自身でも勉強をしてみて、糖についての情報を上手に活用できるようになってください。
【ライター紹介】
宮川 隆 (みやがわ りゅう)
名古屋市立大学薬学部卒業、南カリフォルニア大学(USC)国際薬学臨床研修修了、東京大学大学院理学系研究科修了
薬剤師、理学博士のほか10種類くらいの資格を持つ。
現在は、東京大学医学部附属病院 放射線科 核医学部門 助教&「放射性医薬品の管理責任者」、環境省「原子力災害影響調査等事業」メンバー、日本アイソトープ協会 放射線取扱主任者講習・作業環境測定士講習講師、リクルートメディカルキャリアコラム執筆など本業の合間に、わかりやすくサイエンスを伝える活動に力をいれており、近年は全日本情報学習振興協会にて講師としてYouTube動画の配信も行っている。
【全日本情報学習振興協会YouTube】
https://www.youtube.com/hashtag/%E5%AE%AE%E5%B7%9D%E9%9A%86