中文名稱:貝式分類 英文名稱:Bayesian Classification

📌 定義(Definition)

貝式分類是一種基於貝氏定理的統計分類方法,用來將資料依機率分到不同的類別。簡單來說,就是利用已有資料中各類別的特徵機率,來判斷新資料最可能屬於哪一類。

⭐原理與技術

貝式分類的核心是貝氏定理(Bayes’ Theorem),它描述了如何根據已知條件(例如某特徵出現的機率),來更新事件發生的可能性。
這個過程可以想像成「先有一個猜測(先驗機率),再根據新證據(新資料)來修正這猜測(後驗機率)」。

例如:

  • 先驗機率:一封郵件是垃圾郵件的機率。
  • 證據:郵件中出現某些關鍵字。
  • 後驗機率:基於關鍵字,判斷該郵件是垃圾郵件的可能性。

在機器學習的分類模型中,貝式分類屬於:

  • 以機率為基礎的生成式模型
  • 可解釋性高、計算效率佳
  • 適合作為基準模型或在資料量有限時使用

樸素貝式分類器 (Naive Bayes)

它假設特徵在給定類別下彼此條件獨立,雖然假設簡化,但在文字分類、垃圾郵件過濾等任務中表現良好。

🔗 應用領域

  • 郵件垃圾分類
  • 文件或新聞自動分類
  • 醫療診斷(判斷疾病風險)
  • 文字情感分析
  • 風險評估與詐騙偵測

3 題模擬練習題

  1. 貝式分類的核心理論基礎是什麼?
    A) 熵的最大化
    B) 貝氏定理
    C) 最短路徑算法
    D) 回歸分析
    詳解:貝式分類是基於貝氏定理,用條件機率來判斷資料所屬類別,因此答案是B。

  2. 以下哪項關於朴素貝式分類是假設?
    A) 特徵之間相互獨立
    B) 所有樣本擁有相同標籤
    C) 樣本必須是數值型態
    D) 不需要先驗機率
    詳解:朴素貝式分類假設特徵條件獨立,也就是A。它不強求標籤相同,且可以處理各種型態資料,有先驗機率概念。

  3. 在以下情境中,使用貝式分類最合適的是哪一項?
    A) 利用歷史銷售數據預測未來銷量
    B) 根據郵件內容判斷是否為垃圾郵件
    C) 預測股票價格走勢
    D) 計算導航路徑的最短距離
    詳解:貝式分類常用於分類任務,郵件垃圾分類是典型應用,答案是B。