中文名稱：電腦視覺英文名稱：Computer Vision

📌 定義（Definition）

電腦視是人工智慧的一個分支，旨在使機器能夠理解和解釋數位影像或影片中的內容，模擬人類視覺系統的功能，進而進行物體辨識、追蹤、分析等任務。

⭐ 原理與技術

影像取得（Image Acquisition）
利用攝影機、感測器等設備捕捉數位影像或影片。
影像預處理（Image Preprocessing）
包括去噪、增強、灰階轉換、二值化等，提升影像品質與後續辨識效果。
特徵擷取（Feature Extraction）
從影像中抽取有意義的資訊，如邊緣、角點、紋理、顏色等，常用方法有 SIFT、HOG、ORB。其中，索伯濾波器（Sobel Filter） 是一種經典的邊緣檢測技術，通過計算影像灰階值的梯度來強調邊緣區域，便於後續的邊緣分析與特徵辨識。
影像分割（Image Segmentation）
將影像切割成多個區域或物件，如基於閾值、區域生長、深度學習語義分割（如 U-Net、Mask R-CNN）。
物件偵測（Object Detection）
找出影像中多個物件及其位置，常用模型有 YOLO、SSD、Faster R-CNN。
影像分類（Image Classification）
將影像歸類到特定類別，典型深度學習模型包括 CNN（卷積神經網路）。
姿態估計與追蹤（Pose Estimation & Tracking）
偵測人體或物體的關鍵點位置與動態變化。
深度學習技術（Deep Learning Techniques）
利用大規模資料訓練深度神經網路，提升辨識準確率。
三維重建（3D Reconstruction）
從多張影像或影片中重建三維場景或物體模型。

下列哪項技術主要用於從影像中定位並辨識多個物件？
A. 影像分類
B. 影像分割
C. 物件偵測
D. 姿態估計

答案：C
解析： 物件偵測不僅辨識物件類別，也會標示物件的具體位置（bounding box），與影像分類不同，後者只判斷整張影像的類別。
在電腦視覺中，哪種技術常用於提升影像品質、去除雜訊？
A. 影像預處理
B. 特徵擷取
C. 影像分割
D. 三維重建

答案：A
解析： 影像預處理階段會進行去噪、增強等操作，目的是改善後續分析的效果。
下列哪個深度學習模型常用於物件偵測？
A. YOLO
B. RNN
C. GAN
D. LSTM

答案：A
解析： YOLO（You Only Look Once）是實時物件偵測的代表性模型，RNN和LSTM多用於序列資料，GAN則用於生成模型。