深度學習-深度神經網路

中文名稱：深度學習／深度神經網路英文名稱：Deep Learning / Deep Neural Networks

定義（Definition）

深度學習是一種讓電腦「自己學習」的方法，透過模仿人類大腦神經元連結的方式（稱為神經網路），從大量資料中自動找到有用的特徵（特色），並做出判斷或決定。

這些神經網路由許多相互連結的神經元組成，每個神經元接收前一層的輸出，經過非線性轉換後，再將結果傳遞給下一層。當大量數據反覆輸入神經網路時，網路內部的連接權重會不斷調整，使得模型能夠自動從數據中提取出深層且抽象的特徵。相較於傳統的機器學習方法，深度學習不需要人類專家手動設計特徵，而是讓模型自行學習。

這種方法特別適合處理像影像、語音、文字這種「非結構化資料」，也就是資料沒有固定格式，傳統方法不容易處理。

深度學習的核心是「多層神經網路」，簡單說，就是把神經網路堆疊成很多層，讓電腦能從簡單特徵學到複雜的概念，像是從辨識線條到辨識人臉。
神經網路由輸入層、隱藏層和輸出層組成，透過激勵函數（Activation Function）和反向傳播（Backpropagation）機制，逐步調整權重以最小化損失函數，最終學習出數據間的複雜映射關係。

層（Layer）：神經網路中的一層包含很多神經元，資料會從輸入層開始，逐層傳遞到輸出層。
激活函數（Activation Function）：決定神經元是否「被激活」的數學函數，常見的有 ReLU（線性整流單元）、GELU（高斯誤差線性單元）。 ^6cfb67
- 這些激活函數能幫助避免 梯度消失（Gradient Vanishing） 問題，使網路能更有效率地學習。
Softmax：一種用於多類別分類的函數，能把最後輸出轉換成每個類別的機率，且機率總和為1。
反向傳播（Backpropagation）：訓練神經網路的方法，透過計算錯誤並往回調整參數，讓模型變得更準確。
正規化（Regularization）：防止模型學得太複雜而只記住訓練資料（過擬合），常用方法有 Dropout（隨機丟棄神經元）和 Batch Normalization（批次正規化）。

資料清理→分割訓練/驗證/測試→設計網路→設定損失（交叉熵、MSE）→調參→評估→部署→監控漂移。

電腦視覺：分類、檢測、分割、超解析、影像生成，在製造、醫療、安防皆常見。
自然語言處理：BERT/GPT 做理解與生成，客服、翻譯、摘要、程式輔助。
語音：語音辨識、合成(TTS)、說話人辨識，常用 CNN/RNN/Transformer 聲學模型。
推薦與廣告：預測點擊率、轉換率，使用深度特徵交互與序列建模。
時間序列與異常偵測：預測需求、設備故障，結合注意力提高長期記憶。
醫療/金融：風險評估、診斷輔助，需強調解釋性與合規。共通重點：資料規模與品質是上限；訓練穩定性、正規化與合適架構選擇決定落地成功；部署需兼顧延遲、安全與監控。