なにそれ経営者のブログ

仕事と彼女と人生観

経験値と理論値

先週、国立感染症研究所のレポートで推計約171万人(95%信頼区間:153~189万人)との報告が出された。インフル感染者数が170万人、人口1億2000万人として感染率1.4%。周りの100人に聞いても感染している人がいないからこの確率は間違ってるというのは正しくない。100件に1件と300件に3件はどちらも1%だけど、現実的には1%を当てるために100回じゃ足りない。では何回試行すればそれなりに正しい推定ができるか。この疑問を考えていたら、大数の法則というシンプルなものに行き着いた。「経験的確率と理論的確率が一致する」。で、実際何人に聞けばわかるかというのは感染率1%の場合、誤差10%で38,032人、誤差20%で9,508人。誤差100%で380人。つまり100人に聞いたところでぜんぜん足りない。むしろ誤差でしかない。40,000人くらいに聞いてようやく1%という数値に9割の精度で落ち着く。たしかに最初の100人で1人いるかもしれないけど、そんなに一様には分布していないからたまたま。それなりに精度をあげようとすると、Nをそれなりに上げる必要がある。母数を限定すればそれが答えだけど、サンプルからそれよりも大きな集団の傾向を推定するにはある程度数を集める必要がある。