

岡田 康介
名前:岡田 康介(おかだ こうすけ) ニックネーム:コウ、または「こうちゃん」 年齢:28歳 性別:男性 職業:ブロガー(SEOやライフスタイル系を中心に活動) 居住地:東京都(都心のワンルームマンション) 出身地:千葉県船橋市 身長:175cm 血液型:O型 誕生日:1997年4月3日 趣味:カフェ巡り、写真撮影、ランニング、読書(自己啓発やエッセイ)、映画鑑賞、ガジェット収集 性格:ポジティブでフランク、人見知りはしないタイプ。好奇心旺盛で新しいものにすぐ飛びつく性格。計画性がある一方で、思いついたらすぐ行動するフットワークの軽さもある。 1日(平日)のタイムスケジュール 7:00 起床:軽くストレッチして朝のニュースをチェック。ブラックコーヒーで目を覚ます。 7:30 朝ラン:近所の公園を30分ほどランニング。頭をリセットして新しいアイデアを考える時間。 8:30 朝食&SNSチェック:トーストやヨーグルトを食べながら、TwitterやInstagramでトレンドを確認。 9:30 ブログ執筆スタート:カフェに移動してノートPCで記事を書いたり、リサーチを進める。 12:30 昼食:お気に入りのカフェや定食屋でランチ。食事をしながら読書やネタ探し。 14:00 取材・撮影・リサーチ:街歩きをしながら写真を撮ったり、新しいお店を開拓してネタにする。 16:00 執筆&編集作業:帰宅して集中モードで記事を仕上げ、SEOチェックやアイキャッチ作成も行う。 19:00 夕食:自炊か外食。たまに友人と飲みに行って情報交換。 21:00 ブログのアクセス解析・改善点チェック:Googleアナリティクスやサーチコンソールを見て数字を分析。 22:00 映画鑑賞や趣味の時間:Amazonプライムで映画やドラマを楽しむ。 24:00 就寝:明日のアイデアをメモしてから眠りにつく。
多項分布とは?
多項分布は n 回の独立した試行 において、k 個のカテゴリ がそれぞれどれくらい起こるかを表す確率分布です。ここで 試行 は何回でもかまわず、1 回の試行で取れるのは 1 つのカテゴリだけ という前提です。たとえばサイコロを振るとき、出る目はカテゴリのひとつです。サイコロを n 回振れば、それぞれの目の出る回数を数えることができます。
多項分布は カテゴリの数 k が 2 以上 のときに使います。二項分布は k が 2 のときの特別な場合です。したがって 二項分布は多項分布の特別なケースと考えることができます。
基本の公式
確率変数の組 X1, X2, ..., Xk を考えます。各カテゴリ i に対して確率 pi を割り当て、すべての pi は足し合わせて 1 になるとします。すると X1 + X2 + ... + Xk = n となります。
このとき多項分布は次の式で表されます。P(X1=x1, X2=x2, ..., Xk=xk) = n! / (x1! x2! ... xk!) × p1^x1 × p2^x2 × ... × pk^xk
ここで 各 xi は非負整数で、合計が n でなければなりません。式の意味は、n 回の試行を x1 回赤、x2 回青、... のように割り振る「方法の数」に、各組み合わせの確率を掛け合わせたものです。
やさしい例で理解
色の違うボールを袋から取り出すとします。袋には赤の確率が 0.2、青が 0.5、緑が 0.3 と決めます。回数 n は 5 回とします。すると X1, X2, X3 は x1 + x2 + x3 = 5 となり、それぞれの組み合わせの確率は次のように計算します。
式の書き方の例
P(赤が x1 回, 青が x2 回, 緑が x3 回) = 5! / (x1! x2! x3!) × 0.2^x1 × 0.5^x2 × 0.3^x3
実際の計算の一部を見てみましょう。以下の組み合わせは一例です。
この表の各確率は、公式に従って計算すると sum が 1 に近づきます。実際には組み合わせはもっと多くあり、全部で 1 になるようにちゃんと足します。
ポイントをまとめます。 第1点 多項分布は n 回の試行と k 個のカテゴリの組み合わせを扱います。 第2点 二項分布は多項分布の特別なケースです。 第3点 公式は P(X1=x1,...,Xk=xk)=n!/(x1! x2! ... xk!) × p1^x1 × p2^x2 × ... × pk^xk で、各 xi の合計が n である必要があります。
まとめ
多項分布は日常の「ものごとがどれくらいの回数起こるか」を確率で表すときに使います。例えば商品の色別の売上、イベントの参加カテゴリ分布、ゲームの勝敗パターンなど、さまざまな場面で活躍します。初心者のうちは、まず「n 回の試行」「k カテゴリ」「各カテゴリの確率 p」をしっかり押さえることが大切です。公式を覚えつつ、身近な例で練習すると理解が深まります。
多項分布の同意語
- 多項確率分布
- n回の独立試行を行い、各試行が事前に決まったk個のカテゴリのいずれかに分類されるとき、各カテゴリの出現回数が従う確率分布。パラメータは試行回数nと各カテゴリの確率p1,...,pk(sum = 1)で、結果は(X1,...,Xk)として表される。
- 複数カテゴリ分布
- 複数のカテゴリにまたがる結果を扱う離散確率分布の一種。n回の試行で各回がいずれかのカテゴリに属し、カテゴリごとの出現回数の組(X1,...,Xk)が従う確率分布を指す表現。
- カテゴリ別出現回数の分布
- カテゴリごとに出現回数を数えた結果の分布。n回の独立試行で各試行があるカテゴリに割り当てられ、各カテゴリの出現回数X1,...,Xkの確率を決める離散確率分布。
多項分布の対義語・反対語
- 二項分布
- 多項分布の特別なケースで、カテゴリが2つだけの場合の分布。n回の独立試行のうち、あるカテゴリが出現する回数を数える分布。pはそのカテゴリの確率。
- カテゴリカル分布
- 1回の試行でk種類の結果のいずれかが起こる分布。p_iの和は1。多項分布はn回の試行をまとめて扱うが、カテゴリカル分布は1回の試行を対象とする。
- ベルヌーイ分布
- カテゴリカル分布の特別ケースで、結果が2値(成功と失敗)だけの1回の試行を表す分布。n=1のときの多項分布の対応形とも言える。
- 連続分布
- 確率変数の取り得る値が連続的な分布。多項分布は離散的なカテゴリの回数を扱うのに対し、連続分布は値を連続的に取り得る点が異なる。
- 一様分布
- 全ての結果が等しく起こる確率分布。多項分布のp_iが均等な場合の特性に近づくが、一般には偏りのないケースを指す。
多項分布の共起語
- カテゴリ分布
- 多項分布の別名で、複数のカテゴリに対する確率分布。各カテゴリの確率は p_i で、総和は1。
- 二項分布
- カテゴリ数が2のときの多項分布。n回の試行のうち特定のカテゴリの出現回数を表す特別なケース。
- 確率分布
- 確率変数がとりうる値とそれに対応する確率の分布。多項分布は離散確率分布の一例。
- 確率ベクトル
- 各カテゴリの確率 p_i を並べたベクトル。sum(p_i) = 1 が前提。
- 観測回数
- データとして得られる各カテゴリの出現回数 x_i。
- 試行回数
- 全体の試行の総数 n。x_1 + x_2 + ... + x_k = n。
- カテゴリ数
- 分布が取り扱うカテゴリの数 k。x_1,...,x_k の長さは k。
- 多項係数
- 階乗を使う正規化項 n! / (x_1! x_2! ... x_k!).
- 確率質量関数
- P(X_1=x_1,...,X_k=x_k) の具体的な式。x_i ≥ 0、sum x_i = n。
- 対数尤度
- 観測データの尤度の対数。推定を安定させるために用いる。
- 最尤推定
- 未知の p_i をデータから推定する代表的な推定法。
- Dirichlet分布
- p の共役事前分布。Dirichlet(a) は多項分布のベイズ推定でよく使われる。
- 事前分布
- ベイズ推定で p に与える事前の分布。
- 事後分布
- データ x に基づく p の分布。Dirichlet などと組み合わせると解析が進みやすい。
- 独立性
- 各試行が独立であるという前提。
多項分布の関連用語
- 多項分布
- K 個のカテゴリのうち、n 回の独立試行を繰り返したときの、各カテゴリ i が出る回数 Xi の分布。確率は p1,…,pK で、X1+…+XK=n となる。
- 二項分布
- K=2 の多項分布で、特定の1つのカテゴリの出現回数を数えるときに用いられる。
- カテゴリ分布
- 1 回の試行で各カテゴリがとる確率の分布で、 multinomial の前提となる基礎分布の一つ。
- カテゴリカル分布
- 1 回の試行を1つのカテゴリに割り当てる確率分布で、n 回の試行に拡張したのが多項分布。
- 確率質量関数
- 多項分布の確率を与える公式で、P(X1=x1,...,XK=xK) = n!/(x1! ... xK!) ∏_{i=1}^K p_i^{x_i}、x_i≥0, ∑ x_i = n。
- パラメータ
- 多項分布のパラメータは試行回数 n と各カテゴリの確率 p1,...,pK(pi>0かつ∑ pi=1)で決まる。
- 独立な試行
- 各試行は互いに独立で、同じ分布 p に従って起こる。
- 試行回数 n
- 全体の試行の回数で、Xi の和は必ず n。
- カテゴリ数 K
- カテゴリの総数で、X1,...,XK がとる値の個数を決める。
- 確率ベクトル p
- 各カテゴリが起こる確率のベクトルで、p1+...+pK=1 を満たす。
- 多項係数
- 組み合わせの重みを表す係数で、n! / (x1! x2! ... xK!)。
- 期待値
- 各 Xi の期待値は E[Xi] = n pi。
- 分散
- 各 Xi の分散は Var(Xi) = n pi (1 - pi)。
- 共分散
- Xi と Xj(i ≠ j)の共分散は Cov(Xi, Xj) = -n pi pj。
- ディリクレ分布
- パラメータα1,...,αKを持つ連続分布で、多項分布の共役事前分布として使われる。
- Dirichlet-マルチノミアル分布
- ディリクレ分布を事前として用いた、X1,...,XK の混合のような分布。
- 最尤推定
- パラメータの最頻値推定で、p_i の最尤推定は x_i / n。
- 仮説検定・適合度検定
- 観測データが特定の p に従うかを検定する際に、カイ二乗検定などを用いる。
- 大規模近似
- n が大きいと、X の割合ベクトルは多変量正規分布に近似できる。
- 特別ケース: K=2 → 二項分布
- カテゴリ数が2のときは二項分布として扱われる。
- 超幾何分布との違い
- 多項分布は独立試行(置換あり)に基づくのに対し、超幾何分布は置換なしでのサンプリングを扱う。
- 実装・計算ツール
- Python では scipy.stats.multinomial や NumPy の random.multinomial などで計算・サンプリングができる。
多項分布のおすすめ参考サイト
- 多項分布とは?期待値・分散・共分散の導出も解説 - AVILEN
- 多項分布とは?ビジネスの活用範囲の多い分布 - 青の統計学
- 多項分布とは?ビジネスの活用範囲の多い分布 - 青の統計学
- 【統計入門】多項分布とは?その基本と活用例をわかりやすく解説!