某金融科技公司導入多任務學習架構,讓單一Transformer模型同時執行OCR(Optical Character Recognition)後的文檔分類以及命名實體辨識(Named Entity Recognition, NER)任務,以協助自動歸檔與抽取關鍵金融資訊。在部署初期,團隊發現當模型的NER準確率(Accuracy)提升時,文檔分類準確率反而下降。若模型架構正確且資料品質良好,下列哪一項最可能是造成此現象的原因?
iPAS 考題解析
某金融科技公司導入多任務學習架構,讓單一Transformer模型同時執行OCR(Optical Character Recognition)後的文檔分類以及命名實體辨識(Named Entity Recognition, NER)任務,以協助自動歸檔與抽取關鍵金融資訊。在部署初期,團隊發現當模型的NER準確率(Accuracy)提升時,文檔分類準確率反而下降。若模型架構正確且資料品質良好,下列哪一項最可能是造成此現象的原因?
- A. 模型架構無法同時支援文字分類與序列標注任務(Sequence Labeling)
- B. 文檔分類任務不需要語意化表徵(Contextualized Representation)
- C. 損失函數(Loss Function)未進行權重平衡,導致任務間競爭 ✓ 正確答案
- D. 所使用的BERT模型無法支援多任務輸出頭(Multi-Head Outputs)
詳細解析
多任務學習中,若各任務的損失函數未經適當加權,梯度更新時較大損失的任務會主導參數更新方向,導致損失較小的任務(如文檔分類)效能被犧牲。平衡損失函數權重是解決任務間競爭的關鍵。
出題年份:114 難度:★★☆