在評估大型語言模型,例如 7B、13B、175B 參數規模時,模型規模對基準測試(Benchmark)結果的影響,下列哪一種說法最為恰當?
iPAS 考題解析
在評估大型語言模型,例如 7B、13B、175B 參數規模時,模型規模對基準測試(Benchmark)結果的影響,下列哪一種說法最為恰當?
- A. 小模型在正確調整下能超越大模型,因此模型大小並不重要
- B. 大模型在多數情境下表現較好,但在特定任務上略遜於小模型
- C. 模型規模與基準測試結果完全無關,影響主要來自測試設計
- D. 模型越大,Benchmark 結果可能提升,但幅度取決於訓練數據品質與資源配置 ✓ 正確答案
詳細解析
模型規模增大通常能提升 Benchmark 表現,但提升幅度並非無限,而是受到訓練數據品質、資源配置與任務特性等因素的影響。這是 Scaling Law 研究中的共識:規模有幫助,但不是唯一決定因素。
出題年份:114 難度:★★☆