【社会人の統計学】1-4 データのばらつき

【社会人の統計学】1-4 データのばらつき

「ばらつき」とは、変数の値の散らばりのことです。どんなデータでも平均値だけでは特徴は掴めません。平均値の周りにはどのようにデータが散らばっているのかも、データの性質を考える上で重要になります。 標本分散 はデータの個数, はデータ、はその平均とします。 散布度を表すのによく使われる「標本分散」(sample variance)の定義は以下の通りです: 普遍分散 標本分散に対し、「不偏分散」(unbiased variance)の定義は以下の通りです:分母は標本分散ではなのに対して、不偏分散の定義では$n-1$ です。標本分散は、手元にあるデータの「散らばり」を表す値です。 それに対し、不偏分散…