

岡田 康介
名前:岡田 康介(おかだ こうすけ) ニックネーム:コウ、または「こうちゃん」 年齢:28歳 性別:男性 職業:ブロガー(SEOやライフスタイル系を中心に活動) 居住地:東京都(都心のワンルームマンション) 出身地:千葉県船橋市 身長:175cm 血液型:O型 誕生日:1997年4月3日 趣味:カフェ巡り、写真撮影、ランニング、読書(自己啓発やエッセイ)、映画鑑賞、ガジェット収集 性格:ポジティブでフランク、人見知りはしないタイプ。好奇心旺盛で新しいものにすぐ飛びつく性格。計画性がある一方で、思いついたらすぐ行動するフットワークの軽さもある。 1日(平日)のタイムスケジュール 7:00 起床:軽くストレッチして朝のニュースをチェック。ブラックコーヒーで目を覚ます。 7:30 朝ラン:近所の公園を30分ほどランニング。頭をリセットして新しいアイデアを考える時間。 8:30 朝食&SNSチェック:トーストやヨーグルトを食べながら、TwitterやInstagramでトレンドを確認。 9:30 ブログ執筆スタート:カフェに移動してノートPCで記事を書いたり、リサーチを進める。 12:30 昼食:お気に入りのカフェや定食屋でランチ。食事をしながら読書やネタ探し。 14:00 取材・撮影・リサーチ:街歩きをしながら写真を撮ったり、新しいお店を開拓してネタにする。 16:00 執筆&編集作業:帰宅して集中モードで記事を仕上げ、SEOチェックやアイキャッチ作成も行う。 19:00 夕食:自炊か外食。たまに友人と飲みに行って情報交換。 21:00 ブログのアクセス解析・改善点チェック:Googleアナリティクスやサーチコンソールを見て数字を分析。 22:00 映画鑑賞や趣味の時間:Amazonプライムで映画やドラマを楽しむ。 24:00 就寝:明日のアイデアをメモしてから眠りにつく。
累積分布・とは?
「累積分布」とは、ある確率変数 X が ある値以下になる確率を表す関数です。英語では CDF(Cumulative Distribution Function)と呼ばれ、記号 F(x) で書かれることが多いです。つまり F(x) = P(X ≤ x) です。これは「その値より小さいか同じくらいの範囲の確率がどれくらいか」を示す、確率の積み上げグラフのようなものです。
累積分布は、離散分布と 連続分布 の両方に対応します。離散分布では X が 0,1,2 などの離れた値をとるとき、F(x) は x がどの値以下かで段階的に上がります。連続分布では X が連続的に値をとるとき、F(x) は滑らかな曲線として現れます。
どうやって求めるのか
・離散分布: F(x) = P(X ≤ x) = Σ_{k ≤ x} P(X = k) です。つまり、x 以下になるすべての値の確率を足し合わせます。
・連続分布: F(x) = ∫_{-∞}^{x} f(t) dt です。ここで f(t) は確率密度関数と呼ばれる曲線です。横軸の値を x に固定して、-∞ から x までの面積を求めるイメージです。
身近な例で考えてみよう
例1: テストの点数を X とします。点数は 0 点から 100 点の整数ですが、ここでは連続に近い扱いとして「X ≤ 70 点になる確率」を考えます。現実には教室のデータから経験的に F(70) を求めることが多いです。
例2: カードのゲームで、手札の合計値を X とします。ある閾値以下になる確率を知ることで、戦略を立てやすくなります。
簡単な離散の例を表で見る
以下は、X が 0,1,2 のときの確率分布と累積分布の例です。
もっと身近な連続分布の例
連続分布の代表例として、一様分布 U(0,1) を考えます。密度 f(x) は 0 以上 1 未満で常に 1 です。すると 累積分布は F(x) = 0 for x < 0, F(x) = x for 0 ≤ x ≤ 1, F(x) = 1 for x ≥ 1 となります。
重要な関係と用語
・CDF(累積分布函数) は F(x) で書かれ、確率分布の「積み上げた面積」を表します。
・PDF(確率密度関数) は f(x) で書かれ、連続分布の「密度」を示します。F(x) は f(t) を x まで積分したものです。これにより、PDF からCDF を計算できます。
・逆CDF(分位数関数)は、与えられた確率 p に対して F(x) = p となる x を求める関数です。これを使うと、データの分布を再現する値を取り出しやすくなります。
まとめ
累積分布は「ある値以下になる確率」を直感的に表す考え方です。離散・連続のいずれにも対応し、CDF を知ると確率の計算や統計的判断がぐっと楽になります。
累積分布の同意語
- 累積分布関数
- 確率変数 X がとる値 x 以下の確率 P(X ≤ x) を返す関数。分布の形を表す基本的な量で、CDFと同義に使われることが多いです。
- CDF
- 英語の略称で、累積分布関数を指します。F(x) = P(X ≤ x) の形で表され、日本語文献でも広く用いられます。
- 累積確率関数
- 同じく F(x) = P(X ≤ x) を表す関数で、CDFとほぼ同義として使われることがあります。ただし文献によっては厳密な用語の使い分けがある場合もあります。
- 英語表記: Cumulative Distribution Function
- 英語での正式名称。CDFと同義に使われ、理解を深める際の用語の補足として有用です。
累積分布の対義語・反対語
- 確率密度関数(PDF)
- 連続型の分布を表す密度関数。CDFはこのPDFを区間で積分して得られるため、“累積”とは密接に関係するが、PDF自体は“密度(局所的な値)”を示す。対義語として、累積の概念に対して密度という別の側面を提示します。
- 確率質量関数(PMF)
- 離散型の分布を点ごとに割り当てる関数。CDFはPMFを0からxまでの和として積み上げる形で定義される。累積の対極という意味で対義語扱いがしやすいです。
- 逆累積分布関数(逆CDF/分位点関数)
- CDFの値から対応するxを返す関数。累積の“反対の機能”として、特定の確率pに対する分位点を求める用途で使われる概念です。
- 非累積分布
- 累積的に確率を積み上げる性質を前提としない、各点の確率を直接扱う見方・概念。厳密には対義語というより別の見方・表現ですが、累積に対する反対の意味合いとして捉えることができます。
- 局所密度表現
- CDFの全体的な積み上げではなく、特定の値域における密度を強調する表現。PDFとニュアンスが近いが、“局所”という語でより区間限定の意味を持たせる場合に使われます。
累積分布の共起語
- 確率分布
- ある確率変数が取り得る値の分布のこと。全体としての分布形状を表す基本概念で、CDFはこの分布の累積的な確率情報を提供します。
- 確率密度関数
- 連続分布の確率を密度として表す関数。CDFはこの密度をxで積分した値として求められます。
- 累積分布関数
- F(x) = P(X ≤ x) の形で、ある値以下の確率を返す関数。CDFの正式名称です。
- 経験的累積分布
- データから推定したCDFのこと。観測データを並べて階級ごとに累積確率を算出します。
- 逆関数
- CDFの逆関数。F^{-1}(p) は p の分位点を返します。
- 分位数
- データの百分位点のこと。CDFの逆関数を用いて求めます。
- 標準正規分布
- 平均0、分散1の正規分布。標準正規分布のCDFは標準正規表を用いて求めます。
- 正規分布
- μとσで定義される連続分布。CDFはデータの正規性評価などに用いられます。
- 指数分布
- 待機時間などに用いられる連続分布。CDFは 1 - e^{-λx} の形で表されます。
- ロジスティック分布
- S字型の連続分布で、CDFはロジスティック関数 1/(1+e^{-(x-μ)/s}) で表されます。
- 区間確率
- F(b) - F(a) で a
- 積分
- CDFは確率密度関数を積分して得られる関数です。
- 数値積分
- 解析解が難しい場合に、数値的手法でCDFを求めます。
- 母集団分布
- 母集団全体の確率分布。CDFはこの母集団分布を表現します。
- 標本
- 観測データの集合。標本から経験的CDFを推定します。
- F(x)
- CDFを表す記号の一つ。Fは分布の累積確率関数を指すことが多いです。
- 確率変数
- X のような乱数の取りうる値とそれに対応する確率のこと。
- 離散分布
- 取り得る値が離散的な分布。CDFはPMFの累積和として表されます。
- 連続分布
- 取り得る値が連続的な分布。CDFは連続的に定義されます。
- 生存関数
- 生存分析での S(t) = P(T > t) のこと。CDFは 1 - 生存関数として表されます。
累積分布の関連用語
- 累積分布関数(CDF)
- Xの値x以下になる確率を表す関数。F(x) = P(X ≤ x)。連続分布・離散分布の双方で使われ、xが小さいほど0に、十分大きいと1に近づく。
- 確率密度関数(PDF)
- 連続分布に対する、各値xでの密度を表す関数。P(a ≤ X ≤ b) = ∫_a^b f(x) dx。CDFはPDFを積分して得られる。
- 確率質量関数(PMF)
- 離散分布に対する、各値kでの確率を表す関数。P(X = k) = p_k。CDFはp_kを累積和して得られる。
- 経験分布関数(ECDF)
- 観測データから作るCDFの推定。N個のデータを昇順に並べ、F̂(x) = (データ ≤ x の個数) / N。
- 分位数(分位点)
- 確率pに対応する値xを表す指標。F(x) ≧ p を満たす最小のx。例: p=0.5なら中央値。
- 分位点関数(Quantile function / 逆CDF)
- CDFの逆関数。F⁻¹(p) を求め、pに対する分位数を得る。
- 標準正規分布
- 平均0、分散1の正規分布。CDFはΦ(z)で表され、z= (x-0)/1。
- 正規分布
- 平均μ、標準偏差σの連続分布。CDFはF(x) = Φ((x-μ)/σ)。
- 指数分布
- λを用いる連続分布。CDF: F(x) = 1 - e^{-λx}(x ≥ 0)。
- 一様分布
- 区間[a, b]で値が等しく現れる連続分布。CDF: F(x) = (x - a) / (b - a)(a ≤ x ≤ b)。
- ベータ分布
- 区間[0,1]の連続分布で、形状パラメータα, βを持つ。PDFは f(x) ∝ x^{α-1}(1-x)^{β-1}。CDFは不完全ベータ関数で表される。
- ガンマ分布
- 形状k、尺度θ(またはλ)を持つ連続分布。待ち時間モデルとして使われ、CDFは不完全ガンマ関数で表される。
- カイ二乗分布
- 自由度kの連続分布。正規分布の平方和として現れ、統計的検定に使われる。CDFはχ²_kに基づく。
- t分布
- 自由度νの連続分布。小標本の平均の推定に使われ、正規分布の代替として用いられる。
- ポアソン分布
- 離散分布。平均λのイベント回数を表す。PMF: P(X=k) = e^{-λ} λ^k / k!。CDFは計算で求める。
- ロジスティック分布
- 連続分布で、S字型の確率分布。CDFは1 / (1 + e^{-(x-μ)/s})。
- 連続分布
- 値をとる範囲が連続で、PDFが定義される分布。
- 離散分布
- 値が離れた点だけをとる分布。PMFで各点の確率を定義。
- 母集団分布と標本分布
- 母集団分布はデータが従う“真の”分布。標本分布は母集団分布から得られる統計量の分布。
累積分布のおすすめ参考サイト
- 頻度分布と積算分布とは? - Bettersize
- 確率密度関数と累積分布関数とは?【統計学をやさしく解説】 - note
- 確率密度関数と累積分布関数とは?【統計学をやさしく解説】 - 和から
- 頻度分布と積算分布とは? - Bettersize