累積分布関数と確率密度関数

身長のように連続的な値をとる確率変数の場合、特定の値をとる確率はほとんどの場合0となる。例えば身長が170cmと言っても、正確に170.00000cmのことを言ってるのではなく、四捨五入して170cmになる値 $ ( 169.5 \le X < 170.5 ) $を言ってるに過ぎない。  確率も同様であり、通常は幅を付けた値で確率を考える。例えば,    Pr$ ( 169.5 \le X < 170.5 ) $のような,確率を考える。これを一般化したものが「累積分布関数」(cummulative distribution function, CDF)である。

定義(累積分布関数)
確率変数 $ X$ に対して,

$\displaystyle F(x) =$   Pr$\displaystyle ( X < x ) \quad (-\infty < x < \infty )$ (1)

を確率変 $ X$ の累積分布関数という。簡単に分布関数ということも多い。

定義(確率密度関数) 累積分布関数 $ F(x)$ が微分可能な時,導関数

$\displaystyle f(x) = \frac{d}{dx}F(x)$ (2)

を確率変数 $ X$確率密度関数(probability density function, pdf)という。簡単に密度関数ということも多い。

微分と積分の関係より,密度関数が在るときには,(累積分布関数が微分可能であれば)

Pr$\displaystyle ( X < x ) = F(x) = \int_{-\infty}^x f(t) dt$ (3)

となる。すなわち関数 $ f(x)$$ -\infty$ から $ x$ の間の面積が、累積分布関数の値でとなっている。
この関係を図で眺めてみよう。
クリックして表示される図で、スライダーを動かしたり、矢印をクリックしてみよう。
下側の密度関数の図で赤く塗られた面積が、上の分関数の関数値(高さ、赤い線)となっている。

一般に,
Pr$\displaystyle ( a \le X < b ) = F(b) - F(a) = \int_a^b f(x) dx$ (4)

であり,先の身長170cmの確率は

   Pr$\displaystyle ( 169.5 \le X < 170.5 ) = F(170.5) - F(169.5) = \int_{169.5}^{170.5} f(x) dx$

として,定式化できる。

累積分布関数が確率で定義されていることより,次の性質が成り立っている。

(1) (非負性) $ 0 \le F(x) \le 1$
(2) (単調性) $ F(x_1) \le F(x_2) \quad (x_1 < x_2)$
(3) (右連続性) $ \lim_{x\rightarrow a+0} F(x) = F(a)$
(4) (極限) $ \lim_{x\rightarrow -\infty} F(x)= 0$
  $ \lim_{x\rightarrow \infty} F(x)= 1$



Subsections

Tomoyuki Tarumi 平成15年10月10日

term_cdfpdf_node1