近年來,深度學習研究與應用蓬勃發展,但數據本身可能存在什麼潛在問題?

iPAS 考題解析

近年來,深度學習研究與應用蓬勃發展,但數據本身可能存在什麼潛在問題?

  • A. 數據標註品質鮮少被討論,但它卻直接影響模型性能 ✓ 正確答案
  • B. 數據品質是完美可信賴的
  • C. 大部分情況下,數據不存在類別不平衡問題
  • D. 數據不需要領域知識的輔助

詳細解析

在深度學習快速發展的背景下,資料標註品質(Annotation Quality)常被忽視。標籤噪聲(Label Noise)、標注一致性差、類別不平衡等資料品質問題會直接影響模型訓練效果和泛化能力。實際上,「資料為王」——高品質標注資料比複雜模型架構更重要。

出題年份:114 難度:★★☆