YOLO（你只看一次）是什麼？完整定義與解說

電腦視覺深度學習

術語快查

搜尋意圖： 如果你在找「你只看一次是什麼」或「你只看一次和相近概念差在哪」，先看這頁的短定義、完整說明與延伸比較。

TL;DR： YOLO (You Only Look Once) 是一種即時物件偵測演算法，它將物件偵測視為一個迴歸問題，直接從完整圖像預測邊界框和類別機率。

實用情境： 適合用在閱讀 AI 文章、產品文件或和同事討論時，先用一頁快速對齊概念。

下一步： 先讀完定義，再往下看延伸比較與對應工具，把概念轉成實際應用。

你有沒有想過，模型怎麼能一張圖就把人、車、箱子都圈出來？

你可以把 YOLO 想成一種很快的物件偵測方法，它看完整張圖後，直接同時判斷物件在哪裡、是什麼。

它重要，是因為很多即時場景，比起慢慢找，先快一點更有價值。

你可以把它想成一個把抽象概念拉回日常判斷的提示，先知道它解決什麼問題，再看技術細節。

容易混淆

YOLO vs 兩階段物件偵測 兩階段方法先找候選區域再分類，YOLO 則是一次完成偵測和分類。

YOLO vs 圖像分類 圖像分類只回答「這張圖是什麼」，YOLO 還要回答「它在哪裡」。

YOLO vs 非極大值抑制 NMS 不是偵測模型本體，它是用來去掉重疊重複框的後處理。

最關鍵的區別：YOLO 是又快又直接的偵測法，不只是看圖分類。

記住這句就好

一次看完一張圖，直接找出物件。

實際案例

工廠產線檢查 攝影機每秒都在拍，系統要即時找出瑕疵品或掉落物，YOLO 很適合做高速度偵測。

道路監控 交通系統要快速找出車輛、行人和事故狀況，YOLO 的速度通常比重型兩階段模型更有優勢。

算法與應用

YOLO 的核心精神是把偵測當成一次性的回歸問題。

它通常會搭配邊界框預測、物件信心分數和非極大值抑制，一起完成最後輸出。

在實務上，速度、精準率、模型大小三者常要一起平衡，沒有任何版本能在所有場景都最強。

情境判斷

Q1（直覺題）： 你要在監視器上即時找出闖入的人，YOLO 合適嗎？

→ 合適，因為它特別重視速度和即時性。

Q2（判斷題）： 如果你的場景裡物件非常小、非常密，而且寧可慢一點也要更高精度，YOLO 一定最適合嗎？

→ 不一定。這時要看版本、解析度和替代模型，可能還要改用更重的偵測器。

常見問題

YOLO 版本之間差很多嗎？

差很多，不同版本在骨幹網路、訓練策略和部署方式上都可能有明顯差異。

YOLO 的信心分數是什麼？

它是模型對某個框裡有物件的把握程度，通常也會結合分類分數和框的位置品質。

YOLO 能不能抓小物件？

可以，但通常要更高解析度、多尺度特徵或版本調整，才會比較穩。

YOLO 可以做分割嗎？

有些 YOLO 變體可以延伸到分割任務，但那已經不只是基本偵測輸出了。

容易混淆

記住這句就好

實際案例

算法與應用

情境判斷

常見問題

相關術語

延伸學習

看常見比較

找對應工具

資料來源與參考依據