CLIP 能進行零樣本分類的關鍵特性為何?

iPAS 考題解析

CLIP 能進行零樣本分類的關鍵特性為何?

  • A. 對比式學習將影像與文字映射至共同嵌入空間 ✓ 正確答案
  • B. 透過影像增強擴大訓練集
  • C. 使用監督式 MLP 分類
  • D. 基於自迴歸模型生成文字描述

詳細解析

CLIP 用對比學習讓影像和文字在同一個向量空間中「對齊」。分類時只需要把候選標籤文字和影像都映射到這個空間,看誰最近就是誰——完全不需要針對新類別的訓練資料。

難度:★★★★