今日は真面目に仕事で使っている標準偏差について調べた。
いや、標準偏差が何かしらのデータのばらつきを表してるってことは知ってるんですよね。
でも、nで割るか、n-1で割るか、このあたりが知りたいんです。
標準偏差2=((x1-平均値)2+(x2-平均値)2+・・・+(xn-平均値)2)÷ n or n-1
まずは、統計学の入門書、なになに・・・
「統計学では、とりあえずn-1で割っとけ!」
雑だな。
多変量解析の本、なになに・・・
「nが小さいと実際より標準偏差が小さくなる傾向にあるため、n-1で割る。」
確かにnが大きければ、どちらで割っても同じような値だが・・・
さらに別の本、
「母集団から抜き取ったサンプルの標本標準偏差は、母標準偏差より大きくなる傾向があるので、n-1で割る。これは母標準偏差を推定した量であり、不偏標準偏差と呼ぶ。」
ああ、なんとなく分かった気がした。
おわり
コメント