· theory · 10 min read
確率とベイズの定理の基礎とは?不確実な未来を「予測」する統計学
偶然に頼らない。過去の経験や条件から、未知のことが起きる確率を絞り出す手法を、迷惑メールフィルタを例に解説。

3行まとめ
- 確率: ある事象が起こる可能性の度合い。 0から1 までの数値で表す(100%は1)。 確率は、ある事象がどれくらいの頻度で発生するかを数値化したものです。この数値は、全く起こらない場合を0、必ず起こる場合を1として表現され、IT分野ではシステムの故障率やセキュリティリスクの評価など、不確実性を含む意思決定の基盤となります。
- ベイズの定理: 新しい情報(証拠)を得るたびに、ある仮説(確率)を更新していく考え方。 ベイズの定理は、私たちが最初に持っている「漠然とした予測」を、新��なデータや観察結果という「証拠」に基づいて、より「確かな予測」へと洗練させていくための強力な数学的枠組みです。これは、AIが学習し、世界を理解するプロセスそのものと言えます。
- スパムフィルタの仕組み: 「当選」「激安」などの単語が含まれるメールは、迷惑メールである 確率(事前確率) が高いと判断し、学習を重ねて精度を上げます。 スパムフィルタは、過去の経験から特定のキーワードを含むメールが迷惑メールである 事前確率 を設定します。そして、実際にそのメールを受信し、ユーザーが迷惑メールと判断したという「新しい証拠」が加わるたびに、そのキーワードと迷惑メールである確率の関係を更新し、フィルタリングの精度を継続的に向上させているのです。
試験での出題ポイント
試験では、特に「確率の計算」と「ベイズ統計の考え方」が問われます。 ITパスポート試験や基本情報技術者試験では、これらの概念がIT戦略やシステム開発、AI技術の基礎知識として出題されます。単なる数学的知��としてではなく、具体的なITシステムやビジネスシーンでの応用例と結びつけて理解することが重要です。
- 期待値: 確率と得られる値を掛け合わせて、平均的に得られる値を算出すること(収益予測などで重要)。 期待値は、将来起こりうる複数の結果それぞれに、その発生確率を掛け合わせたものの合計で求められます。例えば、あるITプロジェクトの投資判断において、成功時の利益と失敗時の損失をそれぞれの発生確率と掛け合わせることで、長期的に見てどれくらいの収益が見込めるかを客観的に評価できます。試験では、具体的なシナリオに基づいて期待値を計算させる問題が出題されることがあります。
- ベイズ的な考え方: 最初に持っている不完全な確率(事前確率)を、データという「証拠」を積み重ねて正確な 事後確率 に変えていくプロセスが、AIの「学習」そのものです。 この考え方は、AIが新しいデータを取り入れるたびに、そのモデルの予測精度を高めていく「機械学習」の根幹をなします。例えば、顔認��システムが、最初は「これは人間だ」という低い確信度から始まり、複数の顔画像データを取り込むことで「これは特定の人物だ」という 事後確率 を高めていくのが典型です。試験では、この「確率の更新」というプロセスが、AIのどのような機能に活用されているか、といった概念的な理解が問われます。
- 独立事象: サイコロのように、1回目と2回目の結果が一切関係しないこと。 独立事象とは、ある事象が発生したかどうかが、別の事象の発生確率に影響を与えない関係を指します。例えば、システムのAモジュールが故障する確率と、Bモジュールが故障する確率が互いに影響し合わない場合、これらは独立事象と見なせます。対照的に、一方の事象が他方の確率に影響を与える場合は「従属事象」と呼ばれ、確率の計算方法が異なります。試験では、事象が独立か否かを見極め、適切な確率計算を行う能力が求められます。
【AIハック】生成AIで「不確実な判断」を最適化
確率やベイズの考え方は、AIに「データの更新と予測」をシミュレートさせることで理解が深まります。
プロンプト例:
「あなたはAIの開発者です。最初は『この画像は猫だ』という確率が50%( 事前確率 )でした。しかし、『耳の形』や『鳴き声』というデータ(証拠)が追加されたことで、猫である確率が90%に更新されました。このプロセスを ベイズの定理 の考え方で、ITパスポートの試験用語を使って説明してください。」
AIが「事前確率」から「事後確率」へのアップデートという具体的なステップを提示してくれるため、現代の主流なAI統計の核心が身に付きます。 生成AIは、複雑な概念を具体的なシナリオに落とし込み、ステップバイステップで説明する能力に優れています。このプロンプトを使うことで、ベイズの定理が単なる数式ではなく、AIが現実世界を「学習」し「判断」を下すための強力なフレームワークであることを、より実践的に理解できます。AIの回答を通じて、ITパスポートで問われるような用語(例えば、データマイニングや機械学習)との関連性も深掘りできるでしょう。
まとめ:データで「確信」を深め��う
確率は単なる数学ではなく、不確実なビジネスの世界で「より良い選択」をするための強力なツールです。
試験では、 期待値 の計算問題と、 過去の経験から確率を更新する ベイズの考え方をセットで覚えておきましょう。 IT分野における意思決定は、常に不確実性と隣り合わせです。確率とベイズの定理を学ぶことは、システム障害のリスク評価、セキュリティ脅威の予測、AIモデルの精度向上といった多岐にわたる場面で、論理的かつデータに基づいた「確信」をもって判断を下す力を養うことにつながります。これらの知識は、資格取得だけでなく、実務で活躍するための強力な武器となるでしょう。

