iPAS中級 相關 AI 術語

AI 系統架構描述 AI 應用的整體技術結構，包含資料層、模型層、服務層的設計，以及雲端、邊緣、混合部署等基礎設施配置

系統架構MLOps雲端部署高頻

AI 系統架構是什麼？→

演算法偏見 Algorithmic Bias

演算法偏見是指 AI 模型因訓練資料或設計缺陷而產生對特定族群不公平的預測結果，是 AI 治理與負責任 AI 的核心議題

AI倫理公平性負責任AI 高頻

演算法偏見是什麼？→

異常偵測 Anomaly Detection

異常偵測是指識別數據集中與預期模式顯著不同的數據點，這些異常點可能指示錯誤、欺詐或其他不尋常的事件。

機器學習異常偵測AI應用

異常偵測是什麼？→

變異數分析 ANOVA

變異數分析 (ANOVA) 是一種統計方法，用於比較兩個或多個群體的平均數是否存在顯著差異。它將總變異分解為不同來源的變異。

統計方法模型評估資料處理

變異數分析是什麼？→

自編碼器 Autoencoder

自編碼器是一種神經網路，旨在學習輸入數據的壓縮表示（編碼），然後從該壓縮表示重建原始數據（解碼）。

深度學習資料處理特徵工程

自編碼器是什麼？→

自動特徵工程 Automated Feature Engineering

自動特徵工程利用演算法自動從原始資料中提取、選擇和轉換特徵，以提升機器學習模型的效能。

機器學習模型訓練資料處理

自動特徵工程是什麼？→

B

5 個術語

自助聚合 Bagging

Bagging (Bootstrap Aggregating) 是一種集成學習技術，透過對原始資料集進行多次有放回的抽樣，訓練多個模型，並將它們的預測結果進行平均或投票。

自助聚合是什麼？→

貝氏定理 Bayes Theorem

貝氏定理描述在已知一些條件下，事件發生的機率。它基於先驗機率、條件機率和證據，更新對事件的信念。

機器學習統計方法AI基礎

貝氏定理是什麼？→

貝氏最佳化 Bayesian Optimization

貝氏最佳化是一種用於最佳化黑盒函數的演算法，它使用貝氏模型來建立目標函數的代理模型，並利用該模型來選擇下一個要評估的點，以在最少的迭代次數內找到最佳解。

貝氏最佳化是什麼？→

大數據 Big Data

大數據指規模龐大、速度快速且多樣化的資料集合，傳統資料處理工具難以有效處理，需要專門的技術與架構來儲存、分析與應用

大數據資料處理iPAS初級高頻

大數據是什麼？→

提升算法 Boosting

Boosting 是一種集成學習技術，透過迭代訓練一系列弱學習器，每個學習器都試圖糾正前一個學習器的錯誤，最終將它們組合起來形成一個強學習器。

提升算法是什麼？→

C

5 個術語

膠囊網路 Capsule Network

膠囊網路是一種神經網路架構，旨在解決卷積神經網路在處理物件方向和空間關係上的不足，透過膠囊和路由機制，更有效地捕捉物件的層次結構。

深度學習神經網路電腦視覺

膠囊網路是什麼？→

卡方檢定 Chi-squared Test

卡方檢定是一種統計方法，用於檢驗兩個或多個類別變數之間是否存在顯著關聯性。它比較觀察值與期望值之間的差異。

統計方法模型評估資料處理

卡方檢定是什麼？→

協同過濾 Collaborative Filtering

協同過濾是一種推薦系統技術，透過分析使用者行為或偏好，預測使用者可能感興趣的項目，例如商品、電影或音樂。

推薦系統機器學習資料處理

協同過濾是什麼？→

容器化技術 Containerization

容器化技術是一種將應用程式及其所有依賴項打包到一個可移植容器中的技術，實現跨環境一致的部署。

模型部署MLOpsAI應用

容器化技術是什麼？→

成本效益分析 Cost-Benefit Analysis

成本效益分析是評估 AI 專案投資回報的方法，計算直接節省成本加上間接效益後，扣除導入與維運成本，以判斷專案是否值得執行

成本效益AI導入ROI 高頻

成本效益分析是什麼？→

D

13 個術語

資料不平衡 Data Imbalance

資料不平衡指訓練資料中各類別樣本數量差異懸殊，導致模型傾向預測多數類別，常用 SMOTE 過採樣或欠採樣等技術來處理

資料處理SMOTE模型評估高頻

資料不平衡是什麼？→

資料填補 Data Imputation

資料填補是處理遺失值的方法，透過統計方法估算並替換遺失值，以維持資料完整性，避免分析偏差。

資料處理統計方法機器學習

資料填補是什麼？→

資料標註 Data Labeling

資料標註是指為原始資料添加標籤的過程，這些標籤提供關於資料的額外資訊，用於訓練監督式機器學習模型。

機器學習深度學習電腦視覺

資料標註是什麼？→

資料並行 Data Parallelism

資料並行是一種分散式訓練方法，將資料分割成多份，分配給多個節點，每個節點使用相同模型副本訓練不同資料子集。

資料並行是什麼？→

資料管線 Data Pipeline

資料管線是一系列資料處理步驟，將原始資料轉換為可供分析或模型使用的格式，包含擷取、轉換、載入等階段。

資料處理MLOps模型部署

資料管線是什麼？→

資料前處理 Data Preprocessing

資料前處理是指在將原始資料用於機器學習模型之前，對其進行清理、轉換和整合的過程，以提高模型效能和準確性。

資料前處理是什麼？→

資料隱私 Data Privacy

資料隱私是指保護個人資訊不被未授權存取、蒐集或濫用的原則與實踐，在 AI 系統中需遵循 PDPA 等法規要求

資料隱私法規合規PDPA 高頻

資料隱私是什麼？→

資料視覺化 Data Visualization

資料視覺化是將資料轉換為圖表、圖形等視覺形式的技術，幫助人們更直觀地理解資料模式、趨勢與異常，常用工具包括 Matplotlib、Tableau、Power BI

資料分析視覺化Tableau 中頻

資料視覺化是什麼？→

深度Q網路 Deep Q-Network

深度Q網路（DQN）是一種結合深度學習與Q學習的強化學習演算法，利用深度神經網路逼近Q函數，解決高維度狀態空間的強化學習問題。

機器學習深度學習強化學習

深度Q網路是什麼？→

描述性統計 Descriptive Statistics

描述性統計使用數值摘要（平均數、中位數、標準差等）和圖表來描述資料集的集中趨勢、離散程度與分佈型態，是資料分析的第一步

統計學資料分析iPAS中級高頻

描述性統計是什麼？→

降維處理 Dimensionality Reduction

降維處理旨在減少資料集的特徵數量，同時保留重要資訊，以簡化模型、加速運算並避免維度災難。

降維處理是什麼？→

判別式 AI Discriminative AI

判別式 AI 學習輸入與輸出之間的條件機率 P(Y|X)，直接預測分類或回歸結果，與生成式 AI 學習資料分佈 P(X) 相對

判別式AI分類模型生成式AI對比高頻

判別式 AI 是什麼？→

分散式訓練 Distributed Training

分散式訓練利用多個計算節點，將模型訓練任務分割並行處理，加速大型模型訓練，提升效率。

分散式訓練是什麼？→

E

3 個術語

集成學習 Ensemble Learning

集成學習透過結合多個弱學習器，建立一個強學習器，以提高模型的準確性和泛化能力，常見方法包括Bagging、Boosting和Stacking。

集成學習是什麼？→

期望最大化算法 Expectation Maximization

期望最大化 (EM) 算法是一種迭代算法，用於在存在隱變量的情況下，估計機率模型的參數。它交替執行期望 (E) 步驟和最大化 (M) 步驟。

統計方法機器學習模型訓練

期望最大化算法是什麼？→

梯度爆炸 Exploding Gradient

梯度爆炸是指在深度學習模型訓練中，梯度在反向傳播時變得異常巨大，導致權重更新過大，模型訓練不穩定甚至崩潰。

深度學習模型訓練神經網路

梯度爆炸是什麼？→

F

4 個術語

特徵擷取 Feature Extraction

特徵擷取是從原始資料中自動識別並提取有意義的特徵表示的過程，目的是降低資料維度同時保留關鍵資訊，提升模型學習效率

特徵工程深度學習降維中頻

特徵擷取是什麼？→

特徵縮放 Feature Scaling

特徵縮放是一種資料前處理技術，用於將不同範圍的特徵值縮放到一個統一的範圍內，避免某些特徵主導模型訓練。

特徵縮放是什麼？→

特徵選擇法 Feature Selection

特徵選擇是機器學習中選擇最相關特徵子集的過程，旨在簡化模型、提高準確性、減少過擬合和提升模型的可解釋性。

特徵選擇法是什麼？→

前饋神經網路 Feedforward Neural Network

前饋神經網路是一種訊息單向傳播的神經網路，由輸入層、隱藏層和輸出層組成，廣泛應用於分類和迴歸任務。

深度學習神經網路模型訓練

前饋神經網路是什麼？→

G

6 個術語

閘控循環單元 Gated Recurrent Unit

閘控循環單元（GRU）是一種循環神經網路（RNN）的變體，旨在解決傳統RNN的梯度消失問題，更有效地捕捉長期依賴關係。

深度學習自然語言處理語音辨識

閘控循環單元是什麼？→

生成式 AI Generative AI

生成式 AI 是能夠產生新內容（文字、圖像、音訊、程式碼等）的人工智慧系統，基於學習大量訓練資料的分佈特徵來生成符合語境的輸出

生成式AILLMDiffusion 高頻

生成式 AI 是什麼？→

基因演算法 Genetic Algorithm

基因演算法是一種模擬生物進化過程的優化算法，通過選擇、交叉和突變等操作，逐步演化出更優的解，用於解決複雜的搜索和優化問題。

最佳化機器學習模型訓練

基因演算法是什麼？→

圖形處理器 GPU

圖形處理器（GPU）是一種專為並行處理設計的電子電路，最初用於加速圖像渲染，現廣泛應用於深度學習等需要大量計算的領域。

圖形處理器是什麼？→

梯度提升法 Gradient Boosting

梯度提升法是一種機器學習技術，透過迭代地組合弱學習器（通常是決策樹）來建立強大的預測模型，每次迭代都專注於修正前一個模型的錯誤。

梯度提升法是什麼？→

網格搜尋 Grid Search

網格搜尋是一種超參數調校方法，它窮舉超參數空間中所有可能的組合，並評估每個組合的模型效能。

網格搜尋是什麼？→

H

1 個術語

超參數調校 Hyperparameter Tuning

超參數調校是機器學習中，尋找最佳超參數組合以提升模型效能的過程，涉及多次模型訓練與評估。

超參數調校是什麼？→

K

1 個術語

科莫哥洛夫-斯米爾諾夫檢定 Kolmogorov-Smirnov Test

用於比較樣本分佈與理論分佈是否相同，或兩個樣本是否來自相同分佈的無母數統計檢定。

統計檢定無母數方法資料品質

科莫哥洛夫-斯米爾諾夫檢定是什麼？→

L

2 個術語

詞形還原 Lemmatization

詞形還原是自然語言處理中將單詞還原為其基本形式（詞元）的過程，考慮了單詞的語法和上下文。

自然語言處理資料處理AI基礎

詞形還原是什麼？→

負載均衡 Load Balancing

將運算請求分散至多台伺服器或 AI 推論節點的技術，以提升系統吞吐量、降低延遲並避免單點過載。

系統架構AI推論MLOps

負載均衡是什麼？→

M

7 個術語

最大似然估計 Maximum Likelihood Estimation

最大似然估計 (MLE) 是一種統計方法，用於估計機率分佈的參數，它通過最大化觀察到樣本數據的似然函數來實現。

統計方法機器學習模型訓練

最大似然估計是什麼？→

最小最大值縮放 Min-Max Scaling

將資料線性轉換到指定區間（通常為 [0, 1]）的特徵縮放方法，透過減去最小值再除以值域來實現。

特徵縮放資料前處理正規化

最小最大值縮放是什麼？→

缺失標記 Missing Token

語言模型處理序列時用於表示遮蔽或缺失位置的特殊符號，常見於遮罩語言模型訓練與填空推論任務。

自然語言處理遮罩語言模型BERT

缺失標記是什麼？→

混合精度訓練 Mixed Precision Training

混合精度訓練是一種使用不同精度（如 FP16 和 FP32）的浮點數進行模型訓練的技術，旨在加速訓練過程並減少記憶體佔用。

深度學習模型訓練最佳化

混合精度訓練是什麼？→

模型平行化 Model Parallelism

模型平行化是一種將大型模型分割到多個裝置上進行訓練或推論的技術，以克服單一裝置的記憶體限制。

深度學習模型訓練模型部署

模型平行化是什麼？→

模型登錄庫 Model Registry

模型登錄庫是集中管理 AI 模型版本、追蹤訓練紀錄與部署狀態的系統，如同模型的戶籍系統

模型部署MLOps模型訓練

模型登錄庫是什麼？→

多模態 AI Multimodal AI

多模態 AI 能同時處理並整合多種類型的輸入資料（文字、圖像、聲音、影片等），產生跨模態的理解與輸出

多模態生成式AI視覺語言模型高頻

多模態 AI 是什麼？→

N

2 個術語

神經網路 Neural Network

神經網路是模仿人類大腦神經元結構的機器學習模型，由多層節點（神經元）組成，透過加權求和與激活函數學習複雜的非線性關係

深度學習神經元激活函數高頻

神經網路是什麼？→

正規化 Normalization

正規化是一種資料前處理技術，將資料縮放到一個單位範數，例如L1或L2範數，使每個樣本的向量長度為1。

正規化是什麼？→

O

2 個術語

目標函數 Objective Function

目標函數是機器學習模型訓練中用於評估模型表現的函數，其數值代表模型預測與實際值的差距，優化目標是最小化或最大化此函數。

目標函數是什麼？→

普通最小平方法 OLS

透過最小化殘差平方和來估計線性回歸模型係數的統計方法。

統計方法線性回歸機器學習基礎

普通最小平方法是什麼？→

P

3 個術語

部分同態加密 PHE

允許在加密資料上執行有限種類（加法或乘法之一）的計算，且結果解密後與在明文上執行相同運算相同的密碼技術。

密碼學隱私保護計算聯邦學習

部分同態加密是什麼？→

策略梯度 Policy Gradient

策略梯度是一種直接優化策略的強化學習方法，它通過計算策略梯度來更新策略參數，以最大化預期累積獎勵。

機器學習強化學習模型訓練

策略梯度是什麼？→

預測性分析 Predictive Analytics

預測分析（Predictive Analytics）運用機器學習與統計模型，從歷史資料預測未來趨勢或事件機率，廣泛用於銷售預測、風險管理、客戶流失預防。

機器學習統計方法AI應用

預測性分析是什麼？→

R

1 個術語

隨機搜尋 Random Search

隨機搜尋是一種超參數最佳化方法，它在預定義的超參數空間中隨機選擇參數組合，並評估其性能，以找到最佳的超參數配置。

隨機搜尋是什麼？→

S

3 個術語

半監督學習 Semi-supervised Learning

半監督學習是一種機器學習方法，它結合了少量標記資料和大量未標記資料進行模型訓練，旨在利用未標記資料提升模型效能，降低標記成本。

半監督學習是什麼？→

輪廓係數 Silhouette Score

評估非監督式分群品質的指標，衡量每個樣本與所屬群集的緊密程度相對於鄰近群集的分離程度，數值範圍為 -1 到 1。

機器學習非監督式學習分群評估

輪廓係數是什麼？→

隨機梯度下降 Stochastic Gradient Descent

隨機梯度下降（SGD）是一種迭代優化算法，用於最小化目標函數。它每次迭代僅使用一個或少量樣本計算梯度，加速訓練過程，但可能導致收斂不穩定。

隨機梯度下降是什麼？→

T

1 個術語

張量處理單元 TPU

張量處理單元（TPU）是Google專為加速機器學習工作負載而設計的客製化硬體加速器，尤其擅長處理張量運算，是深度學習的利器。