邊界框偵測是什麼？

Bounding Box — 邊界框偵測的完整解釋

邊界框偵測是一種電腦視覺技術，用於在影像或影片中定位和識別物體，並使用矩形框標示出物體的位置。

邊界框 vs 圖像分類 分類只回答有沒有，邊界框還要回答物體在哪裡。

邊界框 vs 語義分割 邊界框只畫矩形，分割則要描出更精細的輪廓。

邊界框 vs 追蹤 邊界框是單張影像的定位，追蹤是跨時間維持同一物體的軌跡。

先看它要解決的是什麼問題，再看它是不是最合適的方法。

案例 1：行車影像 系統先框出車、人、腳踏車，才能再做距離或風險判斷。

案例 2：賣場盤點 貨架上哪一格缺貨，可以先靠邊界框標出商品位置。

面向重點

核心模型要同時做分類和定位，通常會輸出類別與座標。

評估常用 IoU、Precision、Recall、mAP 來看效果。

注意框得準不代表一定適合後續任務，還要看速度和穩定性。

面向	重點
核心	模型要同時做分類和定位，通常會輸出類別與座標。
評估	常用 IoU、Precision、Recall、mAP 來看效果。
注意	框得準不代表一定適合後續任務，還要看速度和穩定性。

Q1（判斷題）： 如果模型只說照片裡有狗，卻沒說狗在哪，算邊界框偵測嗎？ → 不算，那只是圖像分類。

Q2（判斷題）： 如果兩個物體重疊得很厲害，邊界框就一定夠用嗎？ → 不一定，這時可能要更細的分割或更好的後處理。

常見問題

mAP 是常用評估指標，用來看不同類別和不同 IoU 門檻下的整體表現。

模型可能對同一物體預測出多個候選框，所以要做 NMS。

不一定，太大會吃掉背景，IoU 也可能變差。