中文名稱:貝式分類 英文名稱:Bayesian Classification
📌 定義(Definition)
貝式分類是一種基於貝氏定理的統計分類方法,用來將資料依機率分到不同的類別。簡單來說,就是利用已有資料中各類別的特徵機率,來判斷新資料最可能屬於哪一類。
⭐原理與技術
貝式分類的核心是貝氏定理(Bayes’ Theorem),它描述了如何根據已知條件(例如某特徵出現的機率),來更新事件發生的可能性。
這個過程可以想像成「先有一個猜測(先驗機率),再根據新證據(新資料)來修正這猜測(後驗機率)」。
例如:
- 先驗機率:一封郵件是垃圾郵件的機率。
- 證據:郵件中出現某些關鍵字。
- 後驗機率:基於關鍵字,判斷該郵件是垃圾郵件的可能性。
在機器學習的分類模型中,貝式分類屬於:
- 以機率為基礎的生成式模型
- 可解釋性高、計算效率佳
- 適合作為基準模型或在資料量有限時使用
樸素貝式分類器 (Naive Bayes)
它假設特徵在給定類別下彼此條件獨立,雖然假設簡化,但在文字分類、垃圾郵件過濾等任務中表現良好。
🔗 應用領域
- 郵件垃圾分類
- 文件或新聞自動分類
- 醫療診斷(判斷疾病風險)
- 文字情感分析
- 風險評估與詐騙偵測
3 題模擬練習題
-
貝式分類的核心理論基礎是什麼?
A) 熵的最大化
B) 貝氏定理
C) 最短路徑算法
D) 回歸分析
詳解:貝式分類是基於貝氏定理,用條件機率來判斷資料所屬類別,因此答案是B。 -
以下哪項關於朴素貝式分類是假設?
A) 特徵之間相互獨立
B) 所有樣本擁有相同標籤
C) 樣本必須是數值型態
D) 不需要先驗機率
詳解:朴素貝式分類假設特徵條件獨立,也就是A。它不強求標籤相同,且可以處理各種型態資料,有先驗機率概念。 -
在以下情境中,使用貝式分類最合適的是哪一項?
A) 利用歷史銷售數據預測未來銷量
B) 根據郵件內容判斷是否為垃圾郵件
C) 預測股票價格走勢
D) 計算導航路徑的最短距離
詳解:貝式分類常用於分類任務,郵件垃圾分類是典型應用,答案是B。