中文名稱:電腦視覺 英文名稱:Computer Vision
📌 定義(Definition)
電腦視是人工智慧的一個分支,旨在使機器能夠理解和解釋數位影像或影片中的內容,模擬人類視覺系統的功能,進而進行物體辨識、追蹤、分析等任務。
⭐ 原理與技術
- 影像取得(Image Acquisition)
利用攝影機、感測器等設備捕捉數位影像或影片。 - 影像預處理(Image Preprocessing)
包括去噪、增強、灰階轉換、二值化等,提升影像品質與後續辨識效果。 - 特徵擷取(Feature Extraction)
從影像中抽取有意義的資訊,如邊緣、角點、紋理、顏色等,常用方法有 SIFT、HOG、ORB。其中,索伯濾波器(Sobel Filter) 是一種經典的邊緣檢測技術,通過計算影像灰階值的梯度來強調邊緣區域,便於後續的邊緣分析與特徵辨識。 - 影像分割(Image Segmentation)
將影像切割成多個區域或物件,如基於閾值、區域生長、深度學習語義分割(如 U-Net、Mask R-CNN)。 - 物件偵測(Object Detection)
找出影像中多個物件及其位置,常用模型有 YOLO、SSD、Faster R-CNN。 - 影像分類(Image Classification)
將影像歸類到特定類別,典型深度學習模型包括 CNN(卷積神經網路)。 - 姿態估計與追蹤(Pose Estimation & Tracking)
偵測人體或物體的關鍵點位置與動態變化。 - 深度學習技術(Deep Learning Techniques)
利用大規模資料訓練深度神經網路,提升辨識準確率。 - 三維重建(3D Reconstruction)
從多張影像或影片中重建三維場景或物體模型。
🔗 應用領域
- 自動駕駛:路徑規劃、障礙物偵測與辨識。
- 醫療影像分析:病灶檢測、輔助診斷。
- 智慧監控:異常行為偵測、人臉辨識。
- 工業自動化:瑕疵檢測、機器視覺檢測。
- 零售與行銷:客流分析、貨架管理。
- 增強現實(AR)與虛擬現實(VR):環境感知與互動。
- 農業科技:作物監測、病蟲害檢測。
- 機器人導航與操作:環境感知與目標定位。
3 題模擬練習題
-
下列哪項技術主要用於從影像中定位並辨識多個物件?
A. 影像分類
B. 影像分割
C. 物件偵測
D. 姿態估計答案:C
解析: 物件偵測不僅辨識物件類別,也會標示物件的具體位置(bounding box),與影像分類不同,後者只判斷整張影像的類別。 -
在電腦視覺中,哪種技術常用於提升影像品質、去除雜訊?
A. 影像預處理
B. 特徵擷取
C. 影像分割
D. 三維重建答案:A
解析: 影像預處理階段會進行去噪、增強等操作,目的是改善後續分析的效果。 -
下列哪個深度學習模型常用於物件偵測?
A. YOLO
B. RNN
C. GAN
D. LSTM答案:A
解析: YOLO(You Only Look Once)是實時物件偵測的代表性模型,RNN和LSTM多用於序列資料,GAN則用於生成模型。