某金融科技公司欲導入AI模型協助客服郵件自動分類(投訴、詢問、表揚)。團隊同時考慮兩種模型設計:方案A(生成式路徑):採用VAE建構潛在語意空間,再結合下游分類器進行標籤預測;方案B(鑑別式路徑):採用BERT Classifier直接根據輸入文本進行監督式分類。現有標註資料約2,000筆,資料分佈均勻但擴充成本高。若團隊希望公平比較兩種模型的資料利用效率與泛化能力,下列哪一種實驗設計最能突顯兩者的本質差異?
iPAS 考題解析
某金融科技公司欲導入AI模型協助客服郵件自動分類(投訴、詢問、表揚)。團隊同時考慮兩種模型設計:方案A(生成式路徑):採用VAE建構潛在語意空間,再結合下游分類器進行標籤預測;方案B(鑑別式路徑):採用BERT Classifier直接根據輸入文本進行監督式分類。現有標註資料約2,000筆,資料分佈均勻但擴充成本高。若團隊希望公平比較兩種模型的資料利用效率與泛化能力,下列哪一種實驗設計最能突顯兩者的本質差異?
- A. 在完整資料集上分別訓練兩者,並比較其分類準確率(Accuracy)與推論時間
- B. 在低資源情境(Low-resource Setting)下,逐步減少標註比例(100%、50%、10%),比較其F1-score ✓ 正確答案
- C. 使用GAN自生成文本樣本補足資料,觀察兩模型在資料增強後的精確率(Precision)差異
- D. 在相同訓練資料上固定輸入維度,僅調整模型參數量,比較其對過擬合的敏感度
詳細解析
生成式(VAE)與鑑別式(BERT)模型的本質差異在於對少量標注資料的處理能力:VAE可利用未標注資料學習潛在語意表徵,在標注稀缺時優勢更明顯。逐步減少標注比例的低資源實驗設計能最清楚地突顯兩者的資料效率差異。
出題年份:114 難度:★★☆