KBP的AI應用規劃師筆記

❯

生成式AI風險管理

生成式AI風險管理

2026年2月01日閱讀時間約 5 分鐘

常見風險與防範措施

風險識別

訓練數據洩漏：模型在生成文本時，可能無意重複訓練數據中的特定片段或隱私資訊，從而導致個人或機密資料洩漏。
反向工程：攻擊者可能透過反向工程技術，分析模型的行為來推斷出模型的參數或訓練數據。
提示詞攻擊：攻擊者可能透過多次查詢生成式模型，試圖推斷或重建訓練數據集中的敏感資料。(例如問生成式AI密鑰、機密內容)
對抗性攻擊：攻擊者透過精心設計的輸入來操控模型的輸出，甚至誘導模型洩露隱私訊息。
Data Poisoning (資料投毒)：攻擊者在訓練資料中植入惡意數據，導致模型輸出錯誤結果。

防範措施

身份驗證與授權機制
加密技術：在數據存儲與傳輸過程中使用加密技術
差分隱私技術：導入差分隱私（Differential Privacy）等資料雜訊技術，防止敏感資料外洩。

生成式AI的道德風險

公平性、包容性
引入第三方評估機制，可以對 AI 系統的結果進行更為客觀的審視
黑箱（Black Box）：AI 技術透明性不足，用戶無法理解，削弱結果可性度
AI產生虛假或有害內容，責任歸屬？
推進可解釋性技術（Explainable AI）的研究
去偏見技術（Bias Mitigation Techniques）

相關法規

使用用戶數據要遵守隱私法規（如 GDPR 和 CCPA）
- 《一般資料保護規則》（General Data Protection Regulation, GDPR）
- 《加州消費者隱私法案》（California Consumer Privacy Act, CCPA）
- 要求資料匿名化處理、差分隱私技術
智慧財產權相關法律
高風險應用場景：重大醫療決策、自動駕駛
- 強調可靠性、準確性
- 歐盟人工智慧法案
企業措施
- 定期審查系統合規性
- 遵守資料使用規範
- 與法律專家合作，制定AI內部使用政策

風險種類與風險管理

風險溯源

對數據來源詳細審核
紀錄數據標籤結構，有問題時可以追溯
模型生成透明化，採用可解釋性AI技術

風險文化

提高員工對生成式 AI 風險的認知
定期培訓、案例分享
建立風險報告機制與獎勵政策

風險接受

評估風險容忍度
制定應急計劃
風險接受並非忽視風險，而是一種基於現實條件的理性選擇，透過完善的應急準備，實現風險與效益的平衡。

風險緩解

數據管理
制定風險管理政策
定期評估風險控制策略

風險迴避

針對技術不成熟、可能導致重大損害，可以暫緩開發高風險應用
設置明確的迴避標準：量化發生率、影響程度
準備應對方案
條件成熟後再次評估、推進

風險轉移

購買保險或與外部合作夥伴簽署協議，將部分或全部風險責任轉移給第三方
即便轉移風險，企業仍需保留監控與審核權限，確保技術應用在可控範圍內
風險轉移並非卸責，而是分散壓力與責任的策略，透過與第三方合作提升風險管理效率，同時專注於核心業務的創新與發展

3 題模擬練習題

關係圖譜

常見風險與防範措施
風險識別
防範措施
生成式AI的道德風險
相關法規
風險種類與風險管理
風險溯源
風險文化
風險接受
風險緩解
風險迴避
風險轉移
3 題模擬練習題

反向連結

0. AI應用規劃師初級名詞地圖

Created with Quartz v4.5.2 © 2026

GitHub
Discord Community