什麼是 目標函數(Objective Function)?

目標函數是機器學習模型訓練中用於評估模型表現的函數,其數值代表模型預測與實際值的差距,優化目標是最小化或最大化此函數。

核心概念

目標函數(Objective Function),又稱損失函數(Loss Function)或成本函數(Cost Function),是機器學習模型訓練中用於評估模型預測結果與實際值之間差異的函數。它將模型的預測輸出與真實標籤進行比較,並輸出一個數值,該數值代表了模型的表現。目標函數的數值越小(或越大,取決於優化方向),表示模型的預測越準確。

目標函數的選擇至關重要,它直接影響模型的學習效果和泛化能力。不同的任務和模型需要選擇不同的目標函數。例如,迴歸任務通常使用均方誤差(Mean Squared Error, MSE)或平均絕對誤差(Mean Absolute Error, MAE)作為目標函數,而分類任務則常使用交叉熵損失(Cross-Entropy Loss)或合頁損失(Hinge Loss)。

目標函數可以分為兩大類:

  • 最小化目標函數(Minimization Objective Function): 這類目標函數的目標是找到使函數值最小的參數。例如,均方誤差和交叉熵損失都屬於最小化目標函數。在訓練過程中,模型會不斷調整參數,以降低目標函數的值,從而提高預測準確性。
  • 最大化目標函數(Maximization Objective Function): 這類目標函數的目標是找到使函數值最大的參數。例如,強化學習中的獎勵函數通常屬於最大化目標函數。在訓練過程中,模型會不斷調整策略,以獲得更高的獎勵。

運作原理

目標函數在機器學習模型訓練中扮演著核心角色。其運作原理可以概括為以下幾個步驟:

  1. 模型預測: 模型接收輸入數據,並根據當前的參數進行預測,輸出預測結果。
  2. 計算損失: 目標函數將模型的預測結果與真實標籤進行比較,計算出一個損失值。這個損失值代表了模型預測的誤差程度。
  3. 梯度計算: 根據目標函數,計算損失值相對於模型參數的梯度。梯度指示了參數調整的方向,可以使損失值降低。
  4. 參數更新: 使用優化算法(例如梯度下降)根據梯度更新模型參數。參數更新的目的是使模型在下一次預測時,能夠產生更準確的結果,從而降低目標函數的值。
  5. 迭代: 重複以上步驟,直到目標函數的值收斂到一個可接受的範圍,或者達到預定的訓練迭代次數。

目標函數的選擇會影響梯度計算的複雜度和效率。一些目標函數具有解析解,可以直接計算出梯度,而另一些目標函數則需要使用數值方法進行梯度估計。此外,目標函數的平滑性也會影響優化算法的收斂速度。平滑的目標函數通常更容易優化,而具有許多局部最小值的目標函數則可能導致優化算法陷入局部最優解。

實際應用

目標函數廣泛應用於各種機器學習任務中,以下是一些常見的應用場景:

  • 迴歸任務: 在迴歸任務中,目標是預測一個連續值。常用的目標函數包括均方誤差(MSE)、平均絕對誤差(MAE)和Huber損失。均方誤差對較大的誤差更加敏感,而平均絕對誤差則對離群值更加魯棒。Huber損失則結合了兩者的優點,在誤差較小時使用均方誤差,在誤差較大時使用平均絕對誤差。
  • 分類任務: 在分類任務中,目標是將輸入數據劃分到不同的類別。常用的目標函數包括交叉熵損失(Cross-Entropy Loss)和合頁損失(Hinge Loss)。交叉熵損失通常用於多分類任務,而合頁損失則常用於支持向量機(SVM)等模型。
  • 生成模型: 在生成模型中,目標是學習數據的分布,並生成新的數據樣本。常用的目標函數包括最大似然估計(Maximum Likelihood Estimation, MLE)和生成對抗網絡(Generative Adversarial Networks, GANs)中的對抗損失。
  • 強化學習: 在強化學習中,目標是訓練一個智能體,使其在環境中採取行動,以獲得最大的累積獎勵。常用的目標函數包括獎勵函數和價值函數。

常見誤區

  • 目標函數越小越好: 雖然通常情況下,目標函數的值越小表示模型的表現越好,但並非總是如此。有時候,過小的目標函數值可能意味著模型過擬合了訓練數據,導致泛化能力下降。因此,在選擇目標函數時,需要考慮模型的複雜度和數據的規模,並使用正則化等方法來防止過擬合。
  • 目標函數的選擇不重要: 目標函數的選擇對模型的性能有著至關重要的影響。不同的目標函數會導致不同的優化方向和結果。因此,在選擇目標函數時,需要仔細考慮任務的特性和模型的結構,並進行實驗驗證。
  • 目標函數可以直接優化: 在實際應用中,目標函數通常非常複雜,難以直接優化。因此,需要使用優化算法(例如梯度下降)來迭代地調整模型參數,以逼近目標函數的最優解。優化算法的選擇也會影響模型的訓練效果和收斂速度。

相關術語

常見問題

← 回到 目標函數 快查頁

延伸學習

想看 目標函數 的完整影片教學?前往 美第奇 AI 學院