術語詞典

最佳化相關 AI 術語

瀏覽 AITerms.tw 中標籤為「最佳化」的 AI 術語，快速找到定義、FAQ 與 iPAS 考試重點。

目前篩選：標籤「最佳化」，共 152 個術語。

目前篩選：標籤「最佳化」，共 152 個術語

清除篩選同一術語可隸屬多個主題，因此主題數量會重複計算。

共找到 152 個術語標籤：最佳化清除條件

A

9 個術語

A/B測試 A/B Testing

A/B測試是一種隨機實驗方法，用於比較兩個版本的變數（A 和 B），以確定哪個版本表現更好。常用於優化使用者體驗和提升轉換率。

模型部署模型評估統計方法

A/B測試是什麼？→

激活值檢查點 Activation Checkpointing

在反向傳播時重新計算隱藏層激活值而非存儲，交換計算時間換取記憶體空間，使訓練更大模型成為可能。

模型訓練最佳化神經網路

激活值檢查點是什麼？→

主動學習 Active Learning

一種機器學習策略，由演算法主動選擇最具訊息價值的未標籤樣本進行標籤，以最小化標籤成本並最大化模型性能

機器學習資料處理最佳化

主動學習是什麼？→

演員-評論家 Actor-Critic

演員-評論家是一種強化學習演算法，結合了策略梯度（演員）和時序差分學習（評論家）的優點，以實現更穩定的學習。

強化學習深度學習模型訓練

演員-評論家是什麼？→

自適應梯度 AdaGrad

根據過去梯度的平方和自動調整各參數學習率的最佳化演算法，使高頻參數學習率較小，低頻參數學習率較大。

模型訓練最佳化神經網路

自適應梯度是什麼？→

演算法 Algorithm

演算法是一組定義明確的指令，用於解決特定問題或執行特定任務。它接收輸入，經過一系列步驟處理，並產生輸出。

AI基礎最佳化資料處理

演算法是什麼？→

演算法交易 Algorithmic Trading

演算法交易是指利用電腦程式自動執行交易指令，根據預先設定的規則和模型，在金融市場上進行買賣操作。

金融AIAI應用最佳化

演算法交易是什麼？→

通用人工智慧 Artificial General Intelligence

通用人工智慧（AGI）是指具備與人類同等或超越人類的智慧，能夠理解、學習、適應並在任何智力任務中表現出色的AI系統。

AI基礎機器學習神經網路

通用人工智慧是什麼？→

自動擴展 Auto Scaling

自動擴展根據系統負載自動調整計算資源，動態增加或減少伺服器數量，確保應用程式效能，同時優化成本。

模型部署AI應用機器學習

自動擴展是什麼？→

B

8 個術語

自助聚合 Bagging

Bagging (Bootstrap Aggregating) 是一種集成學習技術，透過對原始資料集進行多次有放回的抽樣，訓練多個模型，並將它們的預測結果進行平均或投票。

機器學習模型訓練模型評估

自助聚合是什麼？→

批次正規化 Batch Normalization

iPAS

批次正規化是一種標準化技巧，針對每層網路的輸入進行調整，使訓練過程更穩定，並允許使用較大的學習率

深度學習模型訓練神經網路

批次正規化是什麼？→

批次大小 Batch Size

批次大小是訓練時每次更新模型參數所使用的樣本數，直接影響訓練速度、記憶體用量與模型收斂穩定性

模型訓練最佳化深度學習

批次大小是什麼？→

低功耗機器學習 Battery-efficient ML

低功耗機器學習是一種專注於減少模型推論時能源消耗的技術，旨在延長行動裝置與邊緣設備的電池續航力。

機器學習模型部署最佳化

低功耗機器學習是什麼？→

貝氏最佳化 Bayesian Optimization

貝氏最佳化是一種用於最佳化黑盒函數的演算法，它使用貝氏模型來建立目標函數的代理模型，並利用該模型來選擇下一個要評估的點，以在最少的迭代次數內找到最佳解。

機器學習模型訓練最佳化

貝氏最佳化是什麼？→

集束搜尋 Beam Search

集束搜尋是一種啟發式搜尋演算法，用於序列預測任務，它在每個時間步保留多個最有可能的候選序列（集束），而非僅僅選擇最佳選項。

自然語言處理生成式AI模型訓練

集束搜尋是什麼？→

偏差方差權衡 Bias-Variance Tradeoff

偏差方差權衡是指在模型訓練中，降低偏差會增加方差，反之亦然。目標是找到一個平衡點，使模型在未見過的數據上表現良好。

機器學習模型訓練模型評估

偏差方差權衡是什麼？→

提升算法 Boosting

Boosting 是一種集成學習技術，透過迭代訓練一系列弱學習器，每個學習器都試圖糾正前一個學習器的錯誤，最終將它們組合起來形成一個強學習器。

機器學習模型訓練模型評估

提升算法是什麼？→

C

11 個術語

金吉拉縮放 Chinchilla Scaling

金吉拉縮放是一種模型縮放法則，旨在透過調整模型大小和訓練資料量，以達到最佳的計算效率，避免過度訓練或訓練不足。

機器學習深度學習大型語言模型

金吉拉縮放是什麼？→

RL組合最佳化 Combinatorial Optimization with RL

利用強化學習演算法來解決複雜組合最佳化問題的技術，透過與環境互動學習最佳決策策略以尋求近似最佳解。

強化學習最佳化機器學習

RL組合最佳化是什麼？→

運算最佳訓練 Compute Optimal Training

運算最佳訓練旨在於給定運算資源下，最大化模型效能。它涉及調整模型大小、資料集大小和訓練步驟，以達到最佳效率。

機器學習模型訓練最佳化

運算最佳訓練是什麼？→

條件數 Condition Number

iPAS

衡量數學問題或演算法對輸入微小變化的敏感程度。

統計方法最佳化模型訓練

條件數是什麼？→

持續學習 Continual Learning

持續學習旨在使AI模型能夠在不遺忘先前知識的情況下，逐步學習新的任務和資料，模擬人類終身學習的能力。

機器學習深度學習模型訓練

持續學習是什麼？→

持續整合設計 Continuous Integration Design

iPAS

持續整合設計是規劃自動化流程，頻繁整合程式碼、建構與測試，旨在提升軟體開發效率與品質。

MLOps模型部署AI應用

持續整合設計是什麼？→

凸優化 Convex Optimization

凸優化是一種數學優化方法，旨在尋找凸函數在凸集合上的最小值。其優點是局部最小值即為全局最小值，易於求解。

最佳化機器學習數學基礎

凸優化是什麼？→

餘弦退火 Cosine Annealing

學習率沿著餘弦函數曲線逐漸衰減，從初始值平滑降低到最小值，使模型在訓練後期細微調整參數。

模型訓練最佳化神經網路

餘弦退火是什麼？→

代價函數 Cost Function

代價函數是所有訓練樣本損失函數的平均值，用於評估模型在整個訓練集上的表現，並作為優化算法的目標。

機器學習深度學習模型訓練

代價函數是什麼？→

交叉熵損失 Cross-entropy

交叉熵損失是一種衡量兩個機率分佈之間差異的損失函數，常用於分類任務中評估模型預測結果與真實標籤的差距。

機器學習深度學習模型訓練

交叉熵損失是什麼？→

晶體結構預測 Crystal Structure Prediction

晶體結構預測是指透過計算機演算法，從給定的化學組成預測材料在特定條件下的穩定三維晶體結構。

機器學習生成式AI最佳化

晶體結構預測是什麼？→

D

8 個術語

資料並行 Data Parallelism

資料並行是一種分散式訓練方法，將資料分割成多份，分配給多個節點，每個節點使用相同模型副本訓練不同資料子集。

機器學習深度學習模型訓練

資料並行是什麼？→

深度Q網路 Deep Q-Network

深度Q網路（DQN）是一種結合深度學習與Q學習的強化學習演算法，利用深度神經網路逼近Q函數，解決高維度狀態空間的強化學習問題。

機器學習深度學習強化學習

深度Q網路是什麼？→

深度強化學習 Deep Reinforcement Learning

深度強化學習結合深度學習與強化學習，透過深度神經網路學習複雜策略，以在特定環境中最大化累積獎勵。

機器學習深度學習強化學習

深度強化學習是什麼？→

骰子損失函數 Dice Loss

Dice Loss是一種用於衡量兩個樣本之間相似度的損失函數，尤其適用於處理不平衡的資料集，常見於圖像分割任務。

深度學習電腦視覺模型訓練

骰子損失函數是什麼？→

直接偏好優化 Direct Preference Optimization

直接偏好優化（DPO）是一種直接利用人類偏好資料，優化語言模型，無需訓練獎勵模型的強化學習替代方案。

強化學習大型語言模型模型訓練

直接偏好優化是什麼？→

分散式訓練 Distributed Training

分散式訓練利用多個計算節點，將模型訓練任務分割並行處理，加速大型模型訓練，提升效率。

機器學習深度學習模型訓練

分散式訓練是什麼？→

隨機丟棄 Dropout

iPAS

隨機丟棄是一種訓練技巧，透過隨機關閉部分神經元，避免網路過度依賴單一路徑，提升模型的泛化能力

深度學習模型訓練神經網路

隨機丟棄是什麼？→

AI藥物發現 Drug Discovery AI

AI藥物發現利用人工智慧加速藥物研發流程，從靶點識別、候選藥物篩選、臨床試驗設計到藥物重定位，降低成本並縮短開發週期。

醫療AI機器學習深度學習

AI藥物發現是什麼？→

E

11 個術語

提前終止 Early Stopping

提前終止是一種機器學習訓練技巧，藉由監控驗證損失，在模型過度擬合前及早停止訓練，以提高泛化能力。

模型訓練模型評估最佳化

提前終止是什麼？→

邊緣運算AI Edge Computing AI

邊緣運算AI是在終端裝置直接執行人工智慧模型的技術，具備低延遲、省頻寬與強化隱私保護等核心優勢。

AI應用模型部署最佳化

邊緣運算AI 是什麼？→

邊緣推理 Edge Inference

邊緣推理是在邊緣設備（如手機、物聯網設備、智能硬體）本地執行機器學習模型推理，而不是發送請求到遠端伺服器。它具有低延遲、隱私保護、離線可用等優勢。

模型部署AI應用最佳化

邊緣推理是什麼？→

高效神經架構搜尋 Efficient Neural Architecture Search

高效神經架構搜尋（Efficient NAS）旨在降低NAS的計算成本，通過架構共享、代理模型等技術加速搜尋過程，找到高性能的神經網路架構。

機器學習深度學習神經網路

高效神經架構搜尋是什麼？→

高效網路 EfficientNet

EfficientNet 是一系列由 Google 開發的卷積神經網路架構，旨在透過複合縮放方法，在準確度和效率之間取得最佳平衡。

深度學習電腦視覺模型訓練

高效網路是什麼？→

集成學習 Ensemble Learning

集成學習透過結合多個弱學習器，建立一個強學習器，以提高模型的準確性和泛化能力，常見方法包括Bagging、Boosting和Stacking。

機器學習模型訓練模型評估

集成學習是什麼？→

證據與證據下界 Evidence

在貝氏推論中，證據指觀測資料的邊際機率。因計算困難，實務上常透過最大化證據下界來最佳化生成模型。

生成式AI統計方法深度學習

證據與證據下界是什麼？→

期望最大化算法 Expectation Maximization

期望最大化 (EM) 算法是一種迭代算法，用於在存在隱變量的情況下，估計機率模型的參數。它交替執行期望 (E) 步驟和最大化 (M) 步驟。

統計方法機器學習模型訓練

期望最大化算法是什麼？→

梯度爆炸 Exploding Gradient

梯度爆炸是指在深度學習模型訓練中，梯度在反向傳播時變得異常巨大，導致權重更新過大，模型訓練不穩定甚至崩潰。

深度學習模型訓練神經網路

梯度爆炸是什麼？→

探索與利用 Exploration vs Exploitation

探索與利用是強化學習中的權衡，探索是指嘗試新動作以發現潛在的更好策略，利用是指使用已知最佳策略以獲得最大獎勵。

強化學習最佳化AI基礎

探索與利用是什麼？→

極端梯度提升 eXtreme Gradient Boosting

GBDT 的進化版，加入正則化防過擬合，支援缺失值和並行化，是比賽和業界的常勝軍

機器學習模型訓練最佳化

極端梯度提升是什麼？→

F

7 個術語

公平性約束 Fairness Constraints

公平性約束是在機器學習模型訓練或部署過程中引入的數學條件，旨在防止系統對特定群體產生偏見，確保演算法決策的公正性。

AI倫理與治理模型訓練機器學習

公平性約束是什麼？→

特徵選擇法 Feature Selection

特徵選擇是機器學習中選擇最相關特徵子集的過程，旨在簡化模型、提高準確性、減少過擬合和提升模型的可解釋性。

機器學習資料處理特徵工程

特徵選擇法是什麼？→

功能開關 Feature Toggle

iPAS

允許在不重新部署程式碼的情況下，動態開啟或關閉特定功能，便於A/B測試與風險管理。

MLOps模型部署AI應用

功能開關是什麼？→

聯邦平均算法 Federated Averaging

聯邦平均算法透過對多個節點的本地模型參數進行加權平均，在不收集原始資料的情況下訓練全局模型。

聯邦學習模型訓練最佳化

聯邦平均算法是什麼？→

回饋迴路 Feedback Loop

回饋迴路是指系統輸出影響其輸入的過程，在AI中用於迭代改進模型效能，透過評估結果並調整參數。

機器學習模型訓練最佳化

回饋迴路是什麼？→

閃電注意力機制 Flash Attention

閃電注意力機制是一種優化注意力計算的技術，透過重新排序計算步驟和利用硬體加速，大幅提升注意力計算的速度和記憶體效率。

機器學習深度學習自然語言處理

閃電注意力機制是什麼？→

焦點損失函數 Focal Loss

焦點損失函數 (Focal Loss) 是一種用於解決物件偵測中類別不平衡問題的損失函數，它通過降低易分類樣本的權重，使模型更關注難分類樣本。

深度學習模型訓練模型評估

焦點損失函數是什麼？→

G

9 個術語

基因演算法 Genetic Algorithm

基因演算法是一種模擬生物進化過程的優化算法，通過選擇、交叉和突變等操作，逐步演化出更優的解，用於解決複雜的搜索和優化問題。

最佳化機器學習模型訓練

基因演算法是什麼？→

梯度累積 Gradient Accumulation

多個訓練步驟內累加梯度，最後進行一次參數更新，有效增加批量大小而不增加記憶體占用，用於訓練記憶體受限的大型模型。

模型訓練最佳化神經網路

梯度累積是什麼？→

梯度提升法 Gradient Boosting

梯度提升法是一種機器學習技術，透過迭代地組合弱學習器（通常是決策樹）來建立強大的預測模型，每次迭代都專注於修正前一個模型的錯誤。

機器學習模型訓練最佳化

梯度提升法是什麼？→

梯度裁剪 Gradient Clipping

梯度裁剪是一種防止梯度爆炸問題的技術，通過限制梯度的大小，確保訓練過程的穩定性，避免模型參數更新過大。

深度學習神經網路模型訓練

梯度裁剪是什麼？→

梯度下降 Gradient Descent

iPAS

梯度下降是一種透過反覆運算，沿損失函數的梯度方向，逐步逼近損失函數最小值的演算法

最佳化模型訓練數學基礎高頻

梯度下降是什麼？→

梯度同步 Gradient Synchronization

iPAS

在分散式機器學習中，匯總多個運算節點的梯度以確保模型參數一致更新的過程。

模型訓練神經網路最佳化

梯度同步是什麼？→

抓取規劃 Grasp Planning

抓取規劃是機器人學中的核心技術，旨在為機器人手臂規劃出有效且穩定的抓取動作，以成功拾取、移動或操作物體，確保任務執行效率與安全性。

機器學習深度學習電腦視覺

抓取規劃是什麼？→

網格搜尋 Grid Search

網格搜尋是一種超參數調校方法，它窮舉超參數空間中所有可能的組合，並評估每個組合的模型效能。

機器學習模型訓練最佳化

網格搜尋是什麼？→

頓悟學習 Grokking

頓悟學習指模型在訓練初期泛化能力差，但經過長時間訓練後，突然展現出良好的泛化能力，如同頓悟一般。

模型訓練模型評估最佳化

頓悟學習是什麼？→

H

3 個術語

階層式強化學習 Hierarchical RL

階層式強化學習將複雜任務分解為多層次的子任務，透過高低層策略協同運作，解決稀疏獎勵與長期規劃問題。

強化學習機器學習神經網路

階層式強化學習是什麼？→

超參數 Hyperparameter

iPAS

超參數是機器學習模型訓練前，由人為設定且影響模型學習效果的參數，例如學習率或網路層數

模型訓練最佳化機器學習

超參數是什麼？→

超參數調校 Hyperparameter Tuning

超參數調校是機器學習中，尋找最佳超參數組合以提升模型效能的過程，涉及多次模型訓練與評估。

機器學習模型訓練最佳化

超參數調校是什麼？→

I

5 個術語

推論最佳化 Inference Optimization

推論最佳化旨在提升已訓練模型的推論速度、降低資源消耗，使其更有效率地部署於實際應用中。

機器學習深度學習模型部署

推論最佳化是什麼？→

資訊對比損失 InfoNCE Loss

iPAS

透過對比正負樣本，最大化互資訊下界的損失函數，主要用於自監督表徵學習。

深度學習自監督學習模型訓練

資訊對比損失是什麼？→

探索不足 Insufficient Exploration

iPAS

探索不足是指代理人過早專注於已知的高回報行為，未充分嘗試其他未知行為，導致陷入局部最佳解的現象。

強化學習模型訓練最佳化

探索不足是什麼？→

逆向設計 Inverse Design

逆向設計是一種從目標性能出發，利用機器學習或最佳化演算法推導出滿足該性能之材料結構或系統參數的方法。

機器學習生成式AI最佳化

逆向設計是什麼？→

逆向運動學 Inverse Kinematics

逆向運動學是計算機器人或骨骼動畫等系統中，為了達到特定末端效應器位置和姿態，各關節需要旋轉的角度。

機器人學最佳化AI應用

逆向運動學是什麼？→

L

12 個術語

L1 正則化 L1 Regularization (Lasso)

L1 正則化透過懲罰權重的絕對值總和，驅使模型將不重要特徵的權重歸零，達到特徵選擇的效果

機器學習最佳化特徵工程

L1 正則化是什麼？→

L2 正則化 L2 Regularization (Ridge)

L2 正則化是一種機器學習技術，透過在損失函數中加入權重平方和的懲罰項，促使模型權重縮小，有效降低模型複雜度並避免過度擬合，提升泛化能力。

機器學習模型訓練最佳化

L2 正則化是什麼？→

拉格朗日乘數 Lagrange Multiplier

拉格朗日乘數是一種尋找約束條件下函數極值的方法。它引入拉格朗日函數，將約束條件納入目標函數，從而將約束優化問題轉化為無約束優化問題。

最佳化數學基礎機器學習

拉格朗日乘數是什麼？→

層歸一化 Layer Normalization

層歸一化是一種神經網路正規化技術，它在每個層級對所有神經元的激活值進行歸一化，以加速訓練並提高泛化能力。

深度學習神經網路模型訓練

層歸一化是什麼？→

學習率 Learning Rate

學習率是機器學習模型訓練中的關鍵超參數，它決定了梯度下降演算法每次更新模型參數的步長與幅度，過大可能導致模型震盪，過小則會使收斂速度緩慢。

模型訓練最佳化

學習率是什麼？→

學習率調度策略 Learning Rate Schedule

iPAS

根據訓練進度動態調整學習率的策略，能幫助模型在初期快速收斂，並在後期穩定尋找全域理想解。

模型訓練最佳化神經網路

學習率調度策略是什麼？→

學習率排程 Learning Rate Scheduling

學習率排程是一種在訓練過程中調整學習率的技術，旨在加速收斂、避免震盪，並提高模型的泛化能力。常見方法包括步階衰減、指數衰減和餘弦退火。

模型訓練最佳化深度學習

學習率排程是什麼？→

學習率預熱 Learning Rate Warmup

訓練初期逐漸增加學習率，避免初始化不佳導致的訓練不穩定，通常在前幾個 epoch 內從 0 線性增加到目標值。

模型訓練最佳化神經網路

學習率預熱是什麼？→

AI負載平衡 Load Balancing for AI

AI負載平衡將AI任務分散到多個計算資源，確保資源有效利用，避免單點過載，提升整體系統效能和穩定性。

模型部署AI應用機器學習

AI負載平衡是什麼？→

對數損失 Log Loss

對數損失（Log Loss）是交叉熵損失在二元分類問題中的特殊形式，衡量模型預測機率與真實標籤之間的差異，數值越小代表模型表現越好。

機器學習深度學習模型訓練

對數損失是什麼？→

邏輯式人工智慧 Logic-based AI

邏輯式人工智慧利用形式邏輯表示知識並進行推論，旨在模擬人類的符號推理過程，解決複雜問題，強調可解釋性。

AI基礎知識圖譜最佳化

邏輯式人工智慧是什麼？→

損失函數 Loss Function

損失函數衡量模型預測與實際值之間的差異，數值越小代表模型預測越準確，是模型訓練中優化目標的關鍵組成部分。

機器學習深度學習模型訓練

損失函數是什麼？→

M

18 個術語

馬可夫決策過程 Markov Decision Process

馬可夫決策過程（MDP）是一種用於建模決策的數學框架，其中結果部分隨機，部分受決策者控制。它廣泛應用於強化學習。

強化學習AI基礎最佳化

馬可夫決策過程是什麼？→

矩陣分解推薦 Matrix Factorization for Recommendations

矩陣分解推薦是一種推薦系統技術，它將用戶-項目互動矩陣分解為兩個低維矩陣，分別代表用戶和項目的隱含特徵，用於預測用戶對未互動項目的偏好。

推薦系統機器學習模型訓練

矩陣分解推薦是什麼？→

最大似然估計 Maximum Likelihood Estimation

最大似然估計 (MLE) 是一種統計方法，用於估計機率分佈的參數，它通過最大化觀察到樣本數據的似然函數來實現。

統計方法機器學習模型訓練

最大似然估計是什麼？→

最大平均差異 Maximum Mean Discrepancy

iPAS

一種衡量兩個機率分佈之間差異的統計距離，常用於生成模型評估與領域適應。

機器學習模型評估統計方法

最大平均差異是什麼？→

元學習 Meta-learning

元學習，又稱學習如何學習，旨在訓練模型能夠快速適應新任務或環境，透過少量樣本即可達到良好的效能。

機器學習深度學習模型訓練

元學習是什麼？→

混合精度訓練 Mixed Precision Training

混合精度訓練是一種使用不同精度（如 FP16 和 FP32）的浮點數進行模型訓練的技術，旨在加速訓練過程並減少記憶體佔用。

深度學習模型訓練最佳化

混合精度訓練是什麼？→

混合正則化 Mixing Regularization

iPAS

混合正則化是一種透過組合兩個或多個訓練樣本及其標籤來生成新訓練數據的技術，藉此擴增資料集多樣性，有效減輕神經網路模型的過擬合現象並提升泛化能力。

深度學習模型訓練資料處理

混合正則化是什麼？→

專家混合模型 Mixture of Experts

專家混合模型是一種機器學習技術，透過結合多個獨立的「專家」模型，針對不同輸入選擇性地激活特定專家，以提升模型整體效能。

機器學習深度學習自然語言處理

專家混合模型是什麼？→

模型快取 Model Caching

模型快取是一種將已訓練的模型儲存在記憶體或快速儲存裝置中，以加速模型載入和推論的技術。

模型部署最佳化機器學習

模型快取是什麼？→

模型壓縮 Model Compression

模型壓縮是指減少機器學習模型大小和計算複雜度的技術，以便在資源有限的設備上部署，同時保持模型性能。

機器學習深度學習模型訓練

模型壓縮是什麼？→

邊緣端模型壓縮 Model Compression for Edge

邊緣端模型壓縮是縮減神經網路體積與運算量的技術，使人工智慧模型能在資源受限的邊緣裝置上順暢執行。

模型部署最佳化深度學習

邊緣端模型壓縮是什麼？→

模型平行化 Model Parallelism

模型平行化是一種將大型模型分割到多個裝置上進行訓練或推論的技術，以克服單一裝置的記憶體限制。

深度學習模型訓練模型部署

模型平行化是什麼？→

基於模型的強化學習 Model-based Reinforcement Learning

學習環境模型（動態和獎賞），用模型進行規劃而非直接與環境互動的強化學習方法。

強化學習模型訓練深度學習

基於模型的強化學習是什麼？→

蒙地卡羅方法 Monte Carlo Method

蒙地卡羅方法是一種利用隨機抽樣來估算數學問題解的計算技術。它通過大量模擬隨機事件，統計結果，從而得到近似解。

統計方法AI基礎模型評估

蒙地卡羅方法是什麼？→

運動規劃 Motion Planning

運動規劃是計算機科學和機器人學中的一個領域，旨在為機器人或其他代理找到從起點到終點的可行路徑，同時避開障礙物並滿足特定約束。

機器人學自動駕駛最佳化

運動規劃是什麼？→

自駕車運動規劃 Motion Planning for Autonomous Vehicles

自駕車運動規劃是為自動駕駛車輛計算安全、可行且最佳行駛路徑的技術，確保車輛能避開障礙物並達成駕駛目標。

最佳化AI應用強化學習

自駕車運動規劃是什麼？→

多代理系統 Multi-Agent System

多代理系統是由多個獨立自主的代理（Agent）組成的計算機系統，這些代理透過相互溝通、協調與合作，共同解決複雜問題或達成特定目標。

AI AgentAI應用機器學習

多代理系統是什麼？→

多任務學習 Multi-task Learning

多任務學習是一種機器學習方法，旨在同時訓練一個模型來執行多個相關任務，以提升模型的泛化能力和效率。

機器學習深度學習模型訓練

多任務學習是什麼？→

N

3 個術語

神經網路架構搜尋 NAS

iPAS

NAS 是一種自動化設計神經網路架構的技術，旨在減少人工設計的試錯成本，讓演算法自行尋找效能最佳的模型結構。

AutoML深度學習最佳化

神經網路架構搜尋是什麼？→

負樣本抽樣 Negative Sampling

iPAS

一種最佳化技術，用於在訓練模型時高效選擇負例，尤其在推薦系統和NLP中。

機器學習自然語言處理推薦系統

負樣本抽樣是什麼？→

神經架構搜尋 Neural Architecture Search

神經架構搜尋(NAS)是一種自動化設計神經網路架構的技術，旨在尋找在特定任務上表現最佳的模型結構，無需人工手動設計。

AutoML神經網路模型訓練

神經架構搜尋是什麼？→

O

4 個術語

目標函數 Objective Function

目標函數是機器學習模型訓練中用於評估模型表現的函數，其數值代表模型預測與實際值的差距，優化目標是最小化或最大化此函數。

機器學習深度學習模型訓練

目標函數是什麼？→

離線強化學習 Offline Reinforcement Learning

從預先收集的固定資料集學習策略，不與環境互動，適合昂貴或危險環境。

強化學習模型訓練AI應用

離線強化學習是什麼？→

線上學習 Online Learning

線上學習是一種機器學習方法，模型在接收到每個新資料點後立即更新，無需儲存所有資料或進行批次訓練，適用於資料流場景。

機器學習模型訓練模型部署

線上學習是什麼？→

最佳化器狀態 Optimizer State

iPAS

指機器學習訓練過程中，最佳化演算法為更新模型權重所儲存的動量、變異數等歷史計算數值。

模型訓練最佳化深度學習

最佳化器狀態是什麼？→

P

6 個術語

模型參數 Parameters

模型參數是機器學習模型在訓練過程中學習到的數值，用於決定模型如何對輸入資料進行轉換和預測。它們是模型的內部變數。

機器學習模型訓練神經網路

模型參數是什麼？→

物理資訊神經網路 Physics-informed Neural Networks

結合物理定律與神經網路的機器學習模型，用於求解偏微分方程，無需大量標籤數據。

神經網路機器學習深度學習

物理資訊神經網路是什麼？→

規劃 Planning

在人工智慧中，規劃是指為達成特定目標，自動生成一系列行動步驟的過程。它涉及預測行動的結果，並選擇最佳的行動序列。

AI基礎最佳化AI應用

規劃是什麼？→

策略梯度 Policy Gradient

策略梯度是一種直接優化策略的強化學習方法，它通過計算策略梯度來更新策略參數，以最大化預期累積獎勵。

機器學習強化學習模型訓練

策略梯度是什麼？→

投資組合最佳化 Portfolio Optimization

投資組合最佳化利用數學模型，在給定的風險承受度下，尋求最大化投資回報或在給定的回報目標下，最小化投資風險。

最佳化金融AI統計方法

投資組合最佳化是什麼？→

模型剪枝 Pruning

模型剪枝是一種減少模型大小和計算複雜度的技術，透過移除模型中不重要的權重或神經元來實現。

機器學習深度學習模型部署

模型剪枝是什麼？→

Q

5 個術語

Q學習 Q-Learning

一種無模型的強化學習演算法，透過估計狀態-行為對的價值函數來找到最優策略。

強化學習模型訓練最佳化

Q學習是什麼？→

量化低秩適配 QLoRA

QLoRA是LoRA的改進版，使用4位量化技術壓縮預訓練模型，進一步降低記憶體需求，實現在消費級硬體上微調大型模型。

機器學習深度學習自然語言處理

量化低秩適配是什麼？→

模型量化 Quantization

模型量化是一種降低模型大小和加速推論的技術，透過減少模型權重和激活值的精度來實現。

機器學習深度學習模型部署

模型量化是什麼？→

量子機器學習 Quantum Machine Learning

結合量子計算與機器學習的跨領域技術，利用量子力學原理加速數據處理與模式識別過程。

機器學習AI基礎最佳化

量子機器學習是什麼？→

佇列長度 Queue Length

iPAS

等待處理的任務或請求數量，是衡量系統負載與響應能力的重要指標。

MLOpsAI應用模型部署

佇列長度是什麼？→

R

10 個術語

隨機搜尋 Random Search

隨機搜尋是一種超參數最佳化方法，它在預定義的超參數空間中隨機選擇參數組合，並評估其性能，以找到最佳的超參數配置。

機器學習模型訓練最佳化

隨機搜尋是什麼？→

速率限制 Rate Limiting

iPAS

一種控制請求頻率的機制，防止系統過載或濫用，確保服務穩定性與資源公平分配。

MLOpsAI應用模型部署

速率限制是什麼？→

正則化 Regularization

正則化是一種在機器學習中用於防止模型過度擬合的關鍵技術，它透過在損失函數中引入懲罰項，有效限制模型參數的複雜度，從而提升模型的泛化能力。

機器學習模型訓練最佳化

正則化是什麼？→

每秒請求數 Requests Per Second

iPAS

每秒請求數 (RPS) 衡量系統每秒處理請求量，是評估 AI 模型部署與 API 服務效能的關鍵指標。

模型部署AI應用MLOps

每秒請求數是什麼？→

獎勵函數 Reward Function

獎勵函數是強化學習中定義代理在特定狀態下採取特定動作後獲得的獎勵的函數，用於引導代理學習期望行為。

強化學習模型訓練最佳化

獎勵函數是什麼？→

獎賞塑形 Reward Shaping

修改強化學習的獎賞函數以加快收斂和改進學習效率的技術。

強化學習模型訓練AI應用

獎賞塑形是什麼？→

環狀注意力 Ring Attention

環狀注意力是一種分散式注意力機制，將注意力計算分散到多個設備上，減少單一設備的記憶體需求，適用於超大型模型。

大型語言模型模型訓練模型部署

環狀注意力是什麼？→

均方根傳播 RMSProp

使用梯度平方的指數加權移動平均調整學習率的最佳化演算法，改進了 AdaGrad 學習率單調遞減的問題。

模型訓練最佳化神經網路

均方根傳播是什麼？→

機器人理財顧問 Robo-Advisor

機器人理財顧問是一種使用演算法和人工智慧來提供自動化投資建議和管理服務的平台，旨在降低投資門檻和成本。

金融AI推薦系統最佳化

機器人理財顧問是什麼？→

S

10 個術語

鞍點 Saddle Point

函數曲面上在某方向為局部最大值，在另一方向為局部最小值之點，形似馬鞍。在最佳化中，理解收斂行為的關鍵概念。

最佳化模型訓練神經網路

鞍點是什麼？→

自我對弈 Self-play

自我對弈是一種強化學習技術，其中智能體與自身的副本進行對弈，從而學習和改進策略，無需外部人類或標記數據。

強化學習模型訓練最佳化

自我對弈是什麼？→

序列比對 Sequence Alignment

序列比對是計算生物學技術，用於找出生物序列間的相似區域，揭示演化關係或功能同源性。

資料處理統計方法最佳化

序列比對是什麼？→

影子部署 Shadow Deployment

影子部署是一種零風險的部署方式，新版本與舊版本同時運行，使用者只看到舊版本的結果，新版本的預測結果被記錄但不返回，用於離線評估新版本的實際性能。

模型部署MLOps最佳化

影子部署是什麼？→

稀疏注意力機制 Sparse Attention

稀疏注意力機制是一種減少注意力機制計算複雜度的技術，透過只關注輸入序列中的部分元素，降低運算量，提升模型效率。

機器學習深度學習自然語言處理

稀疏注意力機制是什麼？→

稀疏性約束 Sparsity Constraint

iPAS

稀疏性約束是一種在機器學習中，強制模型參數或內部表示包含更多零值的正則化技術，以降低運算成本。

機器學習模型訓練最佳化

稀疏性約束是什麼？→

推測解碼 Speculative Decoding

推測解碼是一種加速大型語言模型推論速度的技術，透過小型模型預測多個token，再由大型模型驗證，減少計算量。

大型語言模型模型訓練模型部署

推測解碼是什麼？→

競價型訓練 Spot Instance Training

競價型訓練利用閒置的雲端運算資源，以大幅降低模型訓練成本，但可能因資源回收而中斷。

模型訓練最佳化機器學習

競價型訓練是什麼？→

隨機梯度下降 Stochastic Gradient Descent

隨機梯度下降（SGD）是一種迭代優化算法，用於最小化目標函數。它每次迭代僅使用一個或少量樣本計算梯度，加速訓練過程，但可能導致收斂不穩定。

機器學習深度學習模型訓練

隨機梯度下降是什麼？→

支持向量機 Support Vector Machine

支持向量機是一種機器學習模型，透過尋找最大邊界的超平面，將不同類別的資料有效分隔

機器學習模型訓練統計方法

支持向量機是什麼？→

T

6 個術語

時序差分學習 Temporal Difference Learning

時序差分學習是一種強化學習方法，透過預測未來獎勵並更新預測值，從不完整的序列中學習，無需等待完整結果。

強化學習模型訓練最佳化

時序差分學習是什麼？→

測試時運算 Test-time Compute

測試時運算是指在模型部署後，進行推論時所使用的運算資源。目標是在效能和延遲之間取得平衡，以滿足實際應用需求。

模型部署最佳化模型評估

測試時運算是什麼？→

閾值調整 Threshold Adjustment

改變分類模型的決策閾值來權衡精確率和召回率的技術，預設閾值通常為 0.5，調整閾值可適應不同業務需求

模型評估機器學習最佳化

閾值調整是什麼？→

Top-K 注意力機制 Top-K Attention

iPAS

為降低自注意力複雜度的技術。透過僅保留分數最高的前 K 個鍵值對參與計算，有效減少記憶體與運算開銷。

深度學習大型語言模型最佳化

Top-K 注意力機制是什麼？→

軌跡最佳化 Trajectory Optimization

軌跡最佳化是機器人學與控制領域的關鍵技術，旨在規劃出滿足特定約束條件並最佳化預設目標函數的運動路徑。

最佳化強化學習機器學習

軌跡最佳化是什麼？→

AutoML遷移學習 Transfer Learning for AutoML

AutoML遷移學習利用預訓練模型知識，加速AutoML流程，減少訓練數據需求，提升模型泛化能力，並降低計算成本。

機器學習深度學習AutoML

AutoML遷移學習是什麼？→

V

2 個術語

驗證資料集 Validation Set

驗證資料集用於在模型訓練期間調整超參數和評估模型效能，以防止過擬合，並選擇最佳模型。

機器學習模型訓練模型評估

驗證資料集是什麼？→

梯度消失 Vanishing Gradient

梯度消失是指在深度學習模型訓練中，梯度在反向傳播時逐漸縮小至接近於零，導致淺層網路權重難以更新，模型學習停滯。

深度學習模型訓練神經網路

梯度消失是什麼？→

W

4 個術語

預熱訓練 Warmup

預熱訓練是一種在模型訓練初期，逐步提高學習率的策略，旨在穩定訓練過程，避免初期梯度爆炸或震盪。

深度學習模型訓練最佳化

預熱訓練是什麼？→

學習率預熱策略 Warmup Schedule

iPAS

在模型訓練初期逐漸增加學習率的策略，可防止模型權重在訓練剛開始時因過大的梯度更新而崩潰或發散。

模型訓練最佳化大型語言模型

學習率預熱策略是什麼？→

權重裁剪 Weight Clipping

iPAS

權重裁剪是一種正則化技術，透過將神經網路的權重限制在特定數值範圍內，以增強模型訓練的穩定性與收斂效果。

深度學習模型訓練生成式AI

權重裁剪是什麼？→

權重衰減 Weight Decay

「權重衰減」是深度學習正則化技術，透過懲罰過大權重，防止模型過度擬合，提升泛化能力。

深度學習模型訓練最佳化

權重衰減是什麼？→

Z

1 個術語

ZeRO 優化 ZeRO Optimization

Microsoft 提出的分布式訓練優化技術，通過將梯度、優化器狀態和模型參數分片存儲在多個 GPU 上，大幅降低記憶體占用，支持訓練超大規模模型。

模型訓練最佳化神經網路

ZeRO 優化是什麼？→

最佳化 相關 AI 術語

A/B測試 A/B Testing

激活值檢查點 Activation Checkpointing

主動學習 Active Learning

演員-評論家 Actor-Critic

自適應梯度 AdaGrad

演算法 Algorithm

演算法交易 Algorithmic Trading

通用人工智慧 Artificial General Intelligence

自動擴展 Auto Scaling

自助聚合 Bagging

批次正規化 Batch Normalization

批次大小 Batch Size

低功耗機器學習 Battery-efficient ML

貝氏最佳化 Bayesian Optimization

集束搜尋 Beam Search

偏差方差權衡 Bias-Variance Tradeoff

提升算法 Boosting

金吉拉縮放 Chinchilla Scaling

RL組合最佳化 Combinatorial Optimization with RL

運算最佳訓練 Compute Optimal Training

條件數 Condition Number

持續學習 Continual Learning

持續整合設計 Continuous Integration Design

凸優化 Convex Optimization

餘弦退火 Cosine Annealing

代價函數 Cost Function

交叉熵損失 Cross-entropy

晶體結構預測 Crystal Structure Prediction

資料並行 Data Parallelism

深度Q網路 Deep Q-Network

深度強化學習 Deep Reinforcement Learning

骰子損失函數 Dice Loss

直接偏好優化 Direct Preference Optimization

分散式訓練 Distributed Training

隨機丟棄 Dropout

AI藥物發現 Drug Discovery AI

提前終止 Early Stopping

邊緣運算AI Edge Computing AI

邊緣推理 Edge Inference

高效神經架構搜尋 Efficient Neural Architecture Search

高效網路 EfficientNet

集成學習 Ensemble Learning

證據與證據下界 Evidence

期望最大化算法 Expectation Maximization

梯度爆炸 Exploding Gradient

探索與利用 Exploration vs Exploitation

極端梯度提升 eXtreme Gradient Boosting

公平性約束 Fairness Constraints

特徵選擇法 Feature Selection

功能開關 Feature Toggle

聯邦平均算法 Federated Averaging

回饋迴路 Feedback Loop

閃電注意力機制 Flash Attention

焦點損失函數 Focal Loss

基因演算法 Genetic Algorithm

梯度累積 Gradient Accumulation

梯度提升法 Gradient Boosting

梯度裁剪 Gradient Clipping

梯度下降 Gradient Descent

梯度同步 Gradient Synchronization

抓取規劃 Grasp Planning

網格搜尋 Grid Search

頓悟學習 Grokking

階層式強化學習 Hierarchical RL

超參數 Hyperparameter

超參數調校 Hyperparameter Tuning

推論最佳化 Inference Optimization

資訊對比損失 InfoNCE Loss

探索不足 Insufficient Exploration

逆向設計 Inverse Design

逆向運動學 Inverse Kinematics

L1 正則化 L1 Regularization (Lasso)

L2 正則化 L2 Regularization (Ridge)

拉格朗日乘數 Lagrange Multiplier

層歸一化 Layer Normalization

學習率 Learning Rate

學習率調度策略 Learning Rate Schedule

學習率排程 Learning Rate Scheduling

學習率預熱 Learning Rate Warmup

最佳化相關 AI 術語