中文名稱:生成對抗網路 英文名稱:Generative Adversarial Networks

📌 定義(Definition)

生成對抗網路(GAN)是深度學習中用於生成數據的強大模型,是生成式 AI 中最具代表性的模型之一,由兩個網路組成:生成器(Generator)和判別器(Discriminator),並透過對抗學習共同進步。

⭐原理與技術

工作原理

  • 生成器(Generator):學習真實數據分佈,並接收隨機雜訊作為輸入,生成模擬的數據樣本。
  • 判別器(Discriminator):負責區分輸入數據是真實的還是生成的。
  • 生成器的目標是「欺騙」判別器,使其無法區分數據來源;而判別器則試圖最大化其判斷準確性。這種對抗學習的過程促使生成器逐漸生成更逼真的數據。

優點

  • 能夠生成高品質的數據樣本,適用於影像、文本、語音等多領域。
  • 數據增強模擬中有極大的應用潛力。

缺點:

  • 訓練過程不穩定,可能出現模式崩潰(Mode Collapse)。
  • 需要大量計算資源,對網路結構設計要求高。

VAE vs GAN vs Diffusion(簡單比較表)

🔗 應用領域

  • 圖像生成與修復:在圖像生成領域有著廣泛應用。例如,StyleGAN 能夠生成極具真實感的人臉圖像,而圖像修復技術則可以補全缺損的圖像部分。
  • 風格遷移:可以將圖像轉換為不同風格,如將照片轉換為油畫風格或動漫風格,實現跨領域的視覺轉換。
  • 文本生成:如虛擬對話內容的創建。
  • 語音合成:如生成逼真的語音樣本。
  • 醫療影像生成:在醫療領域,被用來生成稀缺的病理影像樣本,幫助解決數據不平衡問題,從而提高疾病診斷模型的泛化能力。
  • 虛擬場景模擬:可用於創建虛擬場景,如遊戲中的環境模擬、虛擬現 實(VR)場景構建等,增強沉浸式體驗。

3 題模擬練習題