在評估大型語言模型,例如 7B、13B、175B 參數規模時,模型規模對基準測試(Benchmark)結果的影響,下列哪一種說法最為恰當?

iPAS 考題解析

在評估大型語言模型,例如 7B、13B、175B 參數規模時,模型規模對基準測試(Benchmark)結果的影響,下列哪一種說法最為恰當?

  • A. 小模型在正確調整下能超越大模型,因此模型大小並不重要
  • B. 大模型在多數情境下表現較好,但在特定任務上略遜於小模型
  • C. 模型規模與基準測試結果完全無關,影響主要來自測試設計
  • D. 模型越大,Benchmark 結果可能提升,但幅度取決於訓練數據品質與資源配置 ✓ 正確答案

詳細解析

模型規模增大通常能提升 Benchmark 表現,但提升幅度並非無限,而是受到訓練數據品質、資源配置與任務特性等因素的影響。這是 Scaling Law 研究中的共識:規模有幫助,但不是唯一決定因素。

出題年份:114 難度:★★☆