在評估大型語言模型，例如 7B、13B、175B 參數規模時，模型規模對基準測試（Benchmark）結果的影響，下列哪一種說法最為恰當？

Question

Accepted Answer

D. 模型越大，Benchmark 結果可能提升，但幅度取決於訓練數據品質與資源配置。模型規模增大通常能提升 Benchmark 表現，但提升幅度並非無限，而是受到訓練數據品質、資源配置與任務特性等因素的影響。這是 Scaling Law 研究中的共識：規模有幫助，但不是唯一決定因素。

Answer

A. 小模型在正確調整下能超越大模型，因此模型大小並不重要

Answer

B. 大模型在多數情境下表現較好，但在特定任務上略遜於小模型

Answer

C. 模型規模與基準測試結果完全無關，影響主要來自測試設計

Answer

D. 模型越大，Benchmark 結果可能提升，但幅度取決於訓練數據品質與資源配置

iPAS 考題解析