中文名稱:診斷性分析 英文名稱:Diagnostic Analysis

📌 定義(Definition)

診斷性分析旨在探究數據中的特定現象或結果的根本原因。此類分析通常基於敘述性分析的結果,進一步深入了解數據背後的邏輯與影響因素。

⭐原理與技術

鑽取/向下分析 (Drill-down Analysis)

  • 特點與用途:從宏觀數據逐層深入到細節層級,逐步鎖定問題範圍。
  • 應用場景:銷售下降時,透過地區、產品類別或時間段分析,確定問題發生的具體區域或品類。

關聯分析 (Association Analysis)

  • 特點與用途:分析數據項目之間的共現關係或模式。方法如 Apriori 演算法,用於分析超市購物車數據(如「啤酒與尿布的關聯性」)。
  • 應用場景:在推薦系統中發掘產品之間的購買關聯。

因果分析 (Causal Analysis)

  • 特點與用途:透過統計與實驗方法分析變量之間的因果關係,避免混淆相關性與因果性。方法如因果圖(Causal Diagrams)、隨機試驗(A/B 測試)。
  • 應用場景:檢驗行銷活動對銷售增長的實際影響。

應用領域

診斷性分析在 AI 領域中,扮演著揭示模型表現問題根源、使用者行為理解與優化的關鍵角色。透過診斷性分析,我們可以識別哪些因素導致模型偏差,探究使用者流失原因,及優化產品推薦系統的效果。

  • 模型偏差偵測:透過鑽取分析查看模型在不同子群體(例如不同地區、年齡)的誤差分布,找出偏差來源。
  • 使用者行為分析:結合關聯分析發掘某些行為與使用者流失或轉換的關聯性,並透過因果分析驗證行動措施效果。
  • 業務決策支持:診斷過去的事件,如銷售下降或網站流量減少,找出影響因素,支援管理層制定策略。

🛠 資料與工具

  • 資料來源:交易記錄、使用者點擊流、客戶調查數據、時序數據、事件記錄等。
  • 技術工具:SQL、BI 工具(如 Tableau、Power BI)、Python(pandas, scipy, statsmodels)、R 語言,及專門的因果推斷工具(如 DoWhy、CausalNex)。

3 題模擬練習題

題目 1

診斷性分析中,常用於由宏觀數據逐層深入,找出問題具體來源的方法是下列哪一項?

A. 關聯分析
B. 鑽取/向下分析
C. 因果分析
D. 預測分析

答案:B

詳解
鑽取/向下分析(Drill-down Analysis)透過層層深入數據細節,從整體趨勢到底層數據,逐步鎖定問題原點。關聯分析則是挖掘數據項目間的共現模式,因果分析則強調變量間因果關係,預測分析則是利用歷史資料進行未來推估,故此題選 B。

題目 2

在診斷性分析中,若要了解「啤酒與尿布」在超市購物車中經常同時出現的原因,應該使用哪種分析方法?

A. 因果分析
B. 時間序列分析
C. 關聯分析
D. 聚類分析

答案:C

詳解
關聯分析專注於挖掘數據間的共現規律與關聯性,Apriori 演算法即是用來發掘購物籃分析中哪些商品會同時出現。因果分析須進一步驗證因果關係,時間序列分析關注時間變化,聚類分析則是分群,故答案為 C。

題目 3

以下何者為因果分析(Causal Analysis)常見的技術與方法?

A. 聚類演算法與主成分分析
B. 隨機試驗(A/B 測試)與因果圖(Causal Diagrams)
C. 關聯規則與市場籃子分析
D. 預測模型與回歸分析

答案:B

詳解
因果分析的重點在於解析變數之間的因果關係,隨機試驗(A/B 測試)及因果圖是常用工具,幫助判斷一變量是否會對另一變量產生影響。聚類和主成分主要用於降維與分群,關聯規則則是發掘共現性,回歸分析在預測模型中常見,但不一定具因果推斷能力,故選 B。