「確率密度関数」とは?

確率・統計の基礎
No.590
数学

日付:2025年3月17日

本記事では、「確率密度関数」の定義や特徴、正規分布の実例、累積分布関数との関係を丁寧に解説しています。連続型確率の基礎を学びたい方に最適な入門記事です。

目 次

はじめに

離散的な事象とは異なり、連続的な値を取る確率変数では、確率密度関数(PDF: Probability Density Function)が用いられます。
本記事では、確率密度関数の意味や使い方を、わかりやすく紹介いたします。

1. 離散と連続の違い

  • 離散型確率変数:数えられる値(例:サイコロの目)
  • 連続型確率変数:数えきれない値(例:身長、温度)

連続型の場合、ある特定の値を取る確率は 0 になります。
代わりに、ある範囲(区間)での確率を考えます。

2. 確率密度関数(PDF)とは

確率密度関数とは、連続型確率変数において「ある値付近での確率の濃さ(密度)」を表す関数です。
確率密度そのものは確率ではなく、面積を使って確率を表します。

  • f(x)f(x):確率密度関数
  • P(aXb)=abf(x)dxP(a \leq X \leq b) = \int_a^b f(x) dx:区間[a, b]での確率

特徴

  • f(x)0f(x) \geq 0:常に 0 以上
  • 全体の確率は 1:f(x)dx=1\int_{-\infty}^{\infty} f(x) dx = 1

3. 実例:正規分布の確率密度関数

正規分布の確率密度関数は次のように表されます:

f(x)=12πσ2e(xμ)22σ2f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}

この関数の下の面積が、指定区間での確率を示します。

60X7060 \leq X \leq 70の確率

  • この区間の確率は、f(x)f(x)のグラフで 60 から 70 の間の面積として求められます。

4. 確率密度関数を使う意義

  • 連続データの分布を正確に表現
  • 累積分布関数(CDF)を通じて、区間の確率を簡単に計算可能
  • 実データのモデル化や推定に役立つ

5. 累積分布関数(CDF)との関係

確率密度関数 f(x)f(x) を積分すると、累積分布関数 F(x)F(x) になります:

F(x)=xf(t)dtF(x) = \int_{-\infty}^x f(t) dt
  • F(x)F(x):X が x 以下である確率
  • CDF は常に 0 から 1 の範囲

6. まとめ

項目内容
対象連続型確率変数
表現確率密度関数 f(x)f(x)
確率の求め方面積(積分)による
関連累積分布関数 F(x)F(x)

確率密度関数の理解は、連続データの扱い方や統計的推測の基盤となります。
特に、正規分布などの解析では欠かせない概念です。

シリーズ一覧確率・統計の基礎
14