中文名稱:驗證性分析 英文名稱:Confirmatory Data Analysis

📌 定義(Definition)

事先已有明確假設或模型的前提下,使用資料來驗證這些假設是否成立的分析方法。 注重於驗證研究者提出的假設,透過分類、分群、相關性分析以及預測模型等方法,研究人員可以對探索階段所發現的模式進行更深入的挖掘。

⭐原理與技術

常用方法

  • 假設檢定(例如:差異是否顯著)
  • 迴歸分析(驗證變數之間的關係)
  • 模型效能評估(驗證模型是否達標)
  • A/B Test(驗證方案 A 是否優於 B)

🔗 應用領域

在 AI 專案裡,CDA 通常出現在:

  • 模型訓練後
  • 上線前的評估階段
  • 決策是否採用模型時

例如:

  • 這個模型是否真的比人工判斷好?
  • 新模型是否顯著優於舊模型?
  • 加入新特徵是否真的有幫助?

這些都不是探索,而是驗證

3 題模擬練習題

題目一:分析目的判斷(基本陷阱)

某公司在導入 AI 前,先對歷史製程資料進行分析,
目的是找出哪些製程參數可能與不良率有關
目前並沒有事先設定明確假設。

請問這種分析最接近哪一種?

A. 驗證性資料分析(CDA)
B. 探索性資料分析(EDA)
C. 模型驗證(Validation)
D. 正則化分析

正確答案:B

詳解:
題目強調「找出可能有關的因素」且「沒有事先假設」,
這正是探索性資料分析(EDA)的核心精神:
先看資料,再形成假設。

CDA 一定是「先有假設,再驗證」,與題目描述不符。

題目二:分析流程判斷(角色反轉陷阱)

某分析團隊已提出假設:「導入新檢驗流程後,產品不良率將顯著下降。」 接著使用導入前後的資料進行統計檢定,判斷不良率是否真的有顯著差異。

請問此分析屬於哪一類? A. 探索性資料分析(EDA)
B. 驗證性資料分析(CDA)
C. 資料清洗(Data Cleaning)
D. 特徵工程(Feature Engineering)

正確答案:B

詳解:
題目已經明確給出「假設」, 後續只是用資料來檢驗「是否成立」, 這完全符合 CDA 的定義。 很多人會因為「有用資料分析」就誤選 EDA,但關鍵不在工具,而在分析目的與順序

題目三:AI 專案階段判斷(實務混合陷阱)

在一個 AI 專案中,團隊流程如下:

  1. 先檢視資料分布、異常值、變數關係
  2. 根據觀察結果提出模型假設
  3. 使用驗證資料評估模型是否達到預期效果

請問第 1 與第 3 步分別最接近哪一種分析?

A. 第 1 步 CDA;第 3 步 EDA
B. 第 1 步 EDA;第 3 步 CDA
C. 兩步皆為 EDA
D. 兩步皆為 CDA

正確答案:B

詳解:

  • 第 1 步:沒有假設、先理解資料 → EDA
  • 第 3 步:已有模型與目標、用資料驗證結果 → CDA
    這一題是經典的「流程型陷阱題」,
    專門考你能不能把 EDA 與 CDA 放到正確階段。