
正規分布とは
正規分布は、統計学でもっとも基本的な分布。この世界のいろいろなこと、たとえば人間の身長の分布とかテストの点数の分布などは正規分布に従うとされている。
見た目はこんなかんじで、左右対称。
別名
そもそもこの正規分布、もともとは科学実験における誤差が取る値の分布として導かれたもの。なので「誤差分布(Error Distribution)」ともいう。
また数学者ガウス(Johann Carl Friedrich Gauss(1777-1855))にちなんで「ガウス分布」ともいう。(しかし最初にこの式を書いたのはド・モアブル(Abraham de Moivre, 1667-1754)らしい)
正規分布の特徴
ある分布が正規分布に従うかの判断基準はいくつかあるが、代表的なものが以下。
・平均値を中心に左右対称
・平均値と中央値と最頻値が重なる。
・平均値から の間に約68%、
の間に約95%、
の間に約99%のサンプルが収まる。
正規分布の導出
こちらのページで導出をしているので、興味のある方はどうぞ。
ガウス分布の導出
正規分布の関数
確率密度関数
正規分布(Normal Distribution)の確率密度関数(PDF)はこのようになる。
モーメント母関数
coming soon...
標準正規分布
正規分布を扱う上で、平均や分散がどんな値であっても扱い方に変わりはない。なので、平均を0、分散を1として扱いやすくする。これを標準化(もしくは基準化, standardize)といって、標準化した正規分布を標準正規分布(Standard Normal Distribution)という。いったん標準化していろいろ計算したあとで元に戻すのがメジャーなやり方。
確率密度関数
PDFは単純に平均を0、分散を1に置き換えただけ。
累積分布関数
CDFも同様。
標準化の例題
そのまま を計算しても解けるが、とても大変。
なので標準化する。
分散:16 → 1
求める範囲:78以上 = 平均(70) + 8以上 → 平均(0) +
つまり、標準化とはある値が平均よりも標準偏差の何倍離れているかを示すようにするということ。
今回の場合、78という値は70+8なので、平均よりも8上に離れている。標準偏差は4なので、平均よりも標準偏差の2倍だけ上に離れているといえる。
標準正規分布の分散は1、つまり標準偏差は1だから、2よりも上の値をとる確率を求めればいい。
よってこう求まる。