多項分布とは?初心者向けにわかりやすく解説共起語・同意語・対義語も併せて解説!

  • このエントリーをはてなブックマークに追加
多項分布とは?初心者向けにわかりやすく解説共起語・同意語・対義語も併せて解説!
この記事を書いた人

岡田 康介

名前:岡田 康介(おかだ こうすけ) ニックネーム:コウ、または「こうちゃん」 年齢:28歳 性別:男性 職業:ブロガー(SEOやライフスタイル系を中心に活動) 居住地:東京都(都心のワンルームマンション) 出身地:千葉県船橋市 身長:175cm 血液型:O型 誕生日:1997年4月3日 趣味:カフェ巡り、写真撮影、ランニング、読書(自己啓発やエッセイ)、映画鑑賞、ガジェット収集 性格:ポジティブでフランク、人見知りはしないタイプ。好奇心旺盛で新しいものにすぐ飛びつく性格。計画性がある一方で、思いついたらすぐ行動するフットワークの軽さもある。 1日(平日)のタイムスケジュール 7:00 起床:軽くストレッチして朝のニュースをチェック。ブラックコーヒーで目を覚ます。 7:30 朝ラン:近所の公園を30分ほどランニング。頭をリセットして新しいアイデアを考える時間。 8:30 朝食&SNSチェック:トーストやヨーグルトを食べながら、TwitterやInstagramでトレンドを確認。 9:30 ブログ執筆スタート:カフェに移動してノートPCで記事を書いたり、リサーチを進める。 12:30 昼食:お気に入りのカフェや定食屋でランチ。食事をしながら読書やネタ探し。 14:00 取材・撮影・リサーチ:街歩きをしながら写真を撮ったり、新しいお店を開拓してネタにする。 16:00 執筆&編集作業:帰宅して集中モードで記事を仕上げ、SEOチェックやアイキャッチ作成も行う。 19:00 夕食:自炊か外食。たまに友人と飲みに行って情報交換。 21:00 ブログのアクセス解析・改善点チェック:Googleアナリティクスやサーチコンソールを見て数字を分析。 22:00 映画鑑賞や趣味の時間:Amazonプライムで映画やドラマを楽しむ。 24:00 就寝:明日のアイデアをメモしてから眠りにつく。


多項分布とは?

多項分布は n 回の独立した試行 において、k 個のカテゴリ がそれぞれどれくらい起こるかを表す確率分布です。ここで 試行 は何回でもかまわず、1 回の試行で取れるのは 1 つのカテゴリだけ という前提です。たとえばサイコロを振るとき、出る目はカテゴリのひとつです。サイコロを n 回振れば、それぞれの目の出る回数を数えることができます。

多項分布は カテゴリの数 k が 2 以上 のときに使います。二項分布は k が 2 のときの特別な場合です。したがって 二項分布は多項分布の特別なケースと考えることができます。

基本の公式

確率変数の組 X1, X2, ..., Xk を考えます。各カテゴリ i に対して確率 pi を割り当て、すべての pi は足し合わせて 1 になるとします。すると X1 + X2 + ... + Xk = n となります。

このとき多項分布は次の式で表されます。P(X1=x1, X2=x2, ..., Xk=xk) = n! / (x1! x2! ... xk!) × p1^x1 × p2^x2 × ... × pk^xk

ここで 各 xi は非負整数で、合計が n でなければなりません。式の意味は、n 回の試行を x1 回赤、x2 回青、... のように割り振る「方法の数」に、各組み合わせの確率を掛け合わせたものです。

やさしい例で理解

色の違うボールを袋から取り出すとします。袋には赤の確率が 0.2、青が 0.5、緑が 0.3 と決めます。回数 n は 5 回とします。すると X1, X2, X3 は x1 + x2 + x3 = 5 となり、それぞれの組み合わせの確率は次のように計算します。

式の書き方の例

P(赤が x1 回, 青が x2 回, 緑が x3 回) = 5! / (x1! x2! x3!) × 0.2^x1 × 0.5^x2 × 0.3^x3

実際の計算の一部を見てみましょう。以下の組み合わせは一例です。

able>組み合わせ回数の内訳確率赤 2 回, 青 2 回, 緑 1 回x1=2, x2=2, x3=10.09赤 3 回, 青 1 回, 緑 1 回x1=3, x2=1, x3=10.024赤 2 回, 青 1 回, 緑 2 回x1=2, x2=1, x3=20.054赤 1 回, 青 3 回, 緑 1 回x1=1, x2=3, x3=10.150

この表の各確率は、公式に従って計算すると sum が 1 に近づきます。実際には組み合わせはもっと多くあり、全部で 1 になるようにちゃんと足します。

ポイントをまとめます。 第1点 多項分布は n 回の試行k 個のカテゴリの組み合わせを扱います。 第2点 二項分布は多項分布の特別なケースです。 第3点 公式は P(X1=x1,...,Xk=xk)=n!/(x1! x2! ... xk!) × p1^x1 × p2^x2 × ... × pk^xk で、各 xi の合計が n である必要があります。

まとめ

多項分布は日常の「ものごとがどれくらいの回数起こるか」を確率で表すときに使います。例えば商品の色別の売上、イベントの参加カテゴリ分布、ゲームの勝敗パターンなど、さまざまな場面で活躍します。初心者のうちは、まず「n 回の試行」「k カテゴリ」「各カテゴリの確率 p」をしっかり押さえることが大切です。公式を覚えつつ、身近な例で練習すると理解が深まります。


多項分布の同意語

多項確率分布
n回の独立試行を行い、各試行が事前に決まったk個のカテゴリのいずれかに分類されるとき、各カテゴリの出現回数が従う確率分布。パラメータは試行回数nと各カテゴリの確率p1,...,pk(sum = 1)で、結果は(X1,...,Xk)として表される。
複数カテゴリ分布
複数のカテゴリにまたがる結果を扱う離散確率分布の一種。n回の試行で各回がいずれかのカテゴリに属し、カテゴリごとの出現回数の組(X1,...,Xk)が従う確率分布を指す表現。
カテゴリ別出現回数の分布
カテゴリごとに出現回数を数えた結果の分布。n回の独立試行で各試行があるカテゴリに割り当てられ、各カテゴリの出現回数X1,...,Xkの確率を決める離散確率分布。

多項分布の対義語・反対語

二項分布
多項分布の特別なケースで、カテゴリが2つだけの場合の分布。n回の独立試行のうち、あるカテゴリが出現する回数を数える分布。pはそのカテゴリの確率。
カテゴリカル分布
1回の試行でk種類の結果のいずれかが起こる分布。p_iの和は1。多項分布はn回の試行をまとめて扱うが、カテゴリカル分布は1回の試行を対象とする。
ベルヌーイ分布
カテゴリカル分布の特別ケースで、結果が2値(成功と失敗)だけの1回の試行を表す分布。n=1のときの多項分布の対応形とも言える。
連続分布
確率変数の取り得る値が連続的な分布。多項分布は離散的なカテゴリの回数を扱うのに対し、連続分布は値を連続的に取り得る点が異なる。
一様分布
全ての結果が等しく起こる確率分布。多項分布のp_iが均等な場合の特性に近づくが、一般には偏りのないケースを指す。

多項分布の共起語

カテゴリ分布
多項分布の別名で、複数のカテゴリに対する確率分布。各カテゴリの確率は p_i で、総和は1。
二項分布
カテゴリ数が2のときの多項分布。n回の試行のうち特定のカテゴリの出現回数を表す特別なケース。
確率分布
確率変数がとりうる値とそれに対応する確率の分布。多項分布は離散確率分布の一例。
確率ベクトル
各カテゴリの確率 p_i を並べたベクトル。sum(p_i) = 1 が前提。
観測回数
データとして得られる各カテゴリの出現回数 x_i。
試行回数
全体の試行の総数 n。x_1 + x_2 + ... + x_k = n。
カテゴリ数
分布が取り扱うカテゴリの数 k。x_1,...,x_k の長さは k。
多項係数
階乗を使う正規化項 n! / (x_1! x_2! ... x_k!).
確率質量関数
P(X_1=x_1,...,X_k=x_k) の具体的な式。x_i ≥ 0、sum x_i = n。
対数尤度
観測データの尤度の対数。推定を安定させるために用いる。
最尤推定
未知の p_i をデータから推定する代表的な推定法。
Dirichlet分布
p の共役事前分布。Dirichlet(a) は多項分布のベイズ推定でよく使われる。
事前分布
ベイズ推定で p に与える事前の分布。
事後分布
データ x に基づく p の分布。Dirichlet などと組み合わせると解析が進みやすい。
独立性
各試行が独立であるという前提。

多項分布の関連用語

多項分布
K 個のカテゴリのうち、n 回の独立試行を繰り返したときの、各カテゴリ i が出る回数 Xi の分布。確率は p1,…,pK で、X1+…+XK=n となる。
二項分布
K=2 の多項分布で、特定の1つのカテゴリの出現回数を数えるときに用いられる。
カテゴリ分布
1 回の試行で各カテゴリがとる確率の分布で、 multinomial の前提となる基礎分布の一つ。
カテゴリカル分布
1 回の試行を1つのカテゴリに割り当てる確率分布で、n 回の試行に拡張したのが多項分布。
確率質量関数
多項分布の確率を与える公式で、P(X1=x1,...,XK=xK) = n!/(x1! ... xK!) ∏_{i=1}^K p_i^{x_i}、x_i≥0, ∑ x_i = n。
パラメータ
多項分布のパラメータは試行回数 n と各カテゴリの確率 p1,...,pK(pi>0かつ∑ pi=1)で決まる。
独立な試行
各試行は互いに独立で、同じ分布 p に従って起こる。
試行回数 n
全体の試行の回数で、Xi の和は必ず n。
カテゴリ数 K
カテゴリの総数で、X1,...,XK がとる値の個数を決める。
確率ベクトル p
各カテゴリが起こる確率のベクトルで、p1+...+pK=1 を満たす。
多項係数
組み合わせの重みを表す係数で、n! / (x1! x2! ... xK!)。
期待値
各 Xi の期待値は E[Xi] = n pi。
分散
各 Xi の分散は Var(Xi) = n pi (1 - pi)。
共分散
Xi と Xj(i ≠ j)の共分散は Cov(Xi, Xj) = -n pi pj。
ディリクレ分布
パラメータα1,...,αKを持つ連続分布で、多項分布の共役事前分布として使われる。
Dirichlet-マルチノミアル分布
ディリクレ分布を事前として用いた、X1,...,XK の混合のような分布。
最尤推定
パラメータの最頻値推定で、p_i の最尤推定は x_i / n。
仮説検定・適合度検定
観測データが特定の p に従うかを検定する際に、カイ二乗検定などを用いる。
大規模近似
n が大きいと、X の割合ベクトルは多変量正規分布に近似できる。
特別ケース: K=2 → 二項分布
カテゴリ数が2のときは二項分布として扱われる。
超幾何分布との違い
多項分布は独立試行(置換あり)に基づくのに対し、超幾何分布は置換なしでのサンプリングを扱う。
実装・計算ツール
Python では scipy.stats.multinomial や NumPy の random.multinomial などで計算・サンプリングができる。

多項分布のおすすめ参考サイト


学問の人気記事

データ標準化とは?初心者にもわかる基礎と実務での活用法共起語・同意語・対義語も併せて解説!
346viws
閾値(閾値)・とは?初心者向けにわかりやすく解説する基本ガイド共起語・同意語・対義語も併せて解説!
81viws
平安京遷都とは?日本の都が移された理由をやさしく解説共起語・同意語・対義語も併せて解説!
79viws
光触媒とは?初心者にも分かる基本の仕組みと生活での活用術共起語・同意語・対義語も併せて解説!
66viws
静電容量方式とは?初心者向けの仕組みと使い方を徹底解説共起語・同意語・対義語も併せて解説!
59viws
プレシジョンとは?初心者が知るべき正確さの基本と日常・仕事での活用法共起語・同意語・対義語も併せて解説!
58viws
シールリング・とは?を徹底解説!中学生にも分かる入門ガイド共起語・同意語・対義語も併せて解説!
56viws
電気伝導性とは?初心者にもわかる基本と身近な例共起語・同意語・対義語も併せて解説!
51viws
三角形の面積・とは?初心者にも分かる基礎ガイド—正しい求め方と例題共起語・同意語・対義語も併せて解説!
50viws
誇示とは?意味・使い方・例文を徹底解説して分かりやすく理解する共起語・同意語・対義語も併せて解説!
47viws
ください・とは? 初心者向け使い方と意味を徹底解説共起語・同意語・対義語も併せて解説!
41viws
シオニズムとは?基礎知識からよくある誤解まで徹底解説共起語・同意語・対義語も併せて解説!
39viws
慰安婦問題とは?初心者でも分かる歴史と現在をやさしく解説共起語・同意語・対義語も併せて解説!
36viws
ポリプロピレン・とは?初心者でもわかる基本と使い道ガイド共起語・同意語・対義語も併せて解説!
30viws
高等学校・とは?初心者にもわかる基本ガイド共起語・同意語・対義語も併せて解説!
29viws
夢の中とは?初心者向け解説と眠りの謎を紐解くガイド共起語・同意語・対義語も併せて解説!
29viws
監護権とは?初心者でも分かる基本と実際のケース解説共起語・同意語・対義語も併せて解説!
28viws
如何・とは?初心者にもわかる解説と使い方ガイド共起語・同意語・対義語も併せて解説!
27viws
オレフィンとは?初心者にもわかる化学の基礎ガイド共起語・同意語・対義語も併せて解説!
27viws
朗らか・とは?初心者にもわかる意味と使い方ガイド共起語・同意語・対義語も併せて解説!
26viws

新着記事

学問の関連記事