術語詞典

特徵工程相關 AI 術語

瀏覽 AITerms.tw 中標籤為「特徵工程」的 AI 術語，快速找到定義、FAQ 與 iPAS 考試重點。

目前篩選：標籤「特徵工程」，共 96 個術語。

目前篩選：標籤「特徵工程」，共 96 個術語

清除篩選同一術語可隸屬多個主題，因此主題數量會重複計算。

共找到 96 個術語標籤：特徵工程清除條件

A

5 個術語

啟動圖 Activation Map

iPAS

啟動圖是卷積神經網路中，輸入資料經過卷積與啟動函數處理後所輸出的多維度特徵矩陣。

深度學習神經網路電腦視覺

啟動圖是什麼？→

錨框 Anchor Box

錨框(Anchor Box)是在目標檢測中預先定義的一系列具有不同大小和長寬比的矩形框，用於在圖像中生成候選區域，以便模型進行目標分類和邊界框回歸。

深度學習電腦視覺神經網路

錨框是什麼？→

音訊特徵提取 Audio Feature Extraction

從原始音訊訊號中自動計算或學習具有代表性的低維特徵向量，用於後續機器學習任務。

訊號處理音訊分析深度學習

音訊特徵提取是什麼？→

自編碼器 Autoencoder

自編碼器是一種神經網路，旨在學習輸入數據的壓縮表示（編碼），然後從該壓縮表示重建原始數據（解碼）。

深度學習資料處理特徵工程

自編碼器是什麼？→

自動特徵工程 Automated Feature Engineering

自動特徵工程利用演算法自動從原始資料中提取、選擇和轉換特徵，以提升機器學習模型的效能。

機器學習模型訓練資料處理

自動特徵工程是什麼？→

B

5 個術語

詞袋模型 Bag of Words

詞袋模型是一種簡化文本表示的方法，忽略詞語的順序和語法結構，僅統計每個詞語在文本中出現的次數，形成詞頻向量。

自然語言處理機器學習資料處理

詞袋模型是什麼？→

自助聚合 Bagging

Bagging (Bootstrap Aggregating) 是一種集成學習技術，透過對原始資料集進行多次有放回的抽樣，訓練多個模型，並將它們的預測結果進行平均或投票。

機器學習模型訓練模型評估

自助聚合是什麼？→

二進位編碼 Binary Encoding

iPAS

將類別特徵映射為整數，再將這些整數轉換為其二進位表示的特徵工程方法。

機器學習資料處理特徵工程

二進位編碼是什麼？→

提升算法 Boosting

Boosting 是一種集成學習技術，透過迭代訓練一系列弱學習器，每個學習器都試圖糾正前一個學習器的錯誤，最終將它們組合起來形成一個強學習器。

機器學習模型訓練模型評估

提升算法是什麼？→

盒鬚圖 Box Plot

以五數摘要（最小值、Q1、中位數、Q3、最大值）視覺化資料分布與離群值的統計圖表。

資料視覺化EDA統計

盒鬚圖是什麼？→

C

8 個術語

膠囊網路 Capsule Network

膠囊網路是一種神經網路架構，旨在解決卷積神經網路在處理物件方向和空間關係上的不足，透過膠囊和路由機制，更有效地捕捉物件的層次結構。

深度學習神經網路電腦視覺

膠囊網路是什麼？→

類別特徵 Categorical Features

機器學習中取值為有限離散類別的特徵，如性別（男/女）、顏色（紅/綠/藍）、地區等，需要特殊編碼才能用於模型訓練

特徵工程機器學習資料處理

類別特徵是什麼？→

點擊率預測 Click-through Rate Prediction

點擊率預測旨在預估使用者點擊特定廣告或連結的可能性，是數位廣告和推薦系統的核心技術。

機器學習深度學習推薦系統

點擊率預測是什麼？→

內容過濾推薦 Content-based Filtering

內容過濾推薦是一種推薦系統方法，它基於用戶過去互動過的項目內容特徵，向用戶推薦相似的項目。它分析項目描述，並匹配用戶偏好。

推薦系統自然語言處理特徵工程

內容過濾推薦是什麼？→

對比學習 Contrastive Learning

對比學習是一種自監督學習方法，通過學習區分相似和不相似的樣本，從而提取資料的有效表示，無需人工標註。

機器學習深度學習自監督學習

對比學習是什麼？→

共變數偏移 Covariate Drift

iPAS

共變數偏移是指機器學習模型在訓練與推論階段，輸入特徵的資料分佈發生改變，但給定特徵下的目標變數條件分佈保持不變的現象。

機器學習模型部署特徵工程

共變數偏移是什麼？→

維度詛咒 Curse of Dimensionality

隨著資料維度增加，樣本空間呈指數級膨脹，導致資料密度急劇下降、距離量度失效，使機器學習模型的訓練難度與資料需求大幅提高。

機器學習特徵工程模型評估

維度詛咒是什麼？→

D

9 個術語

資料與數據 Data

資料是機器學習模型的學習基礎，包含結構化與非結構化形式，驅動 AI 系統發展。

資料處理特徵工程自監督學習

資料與數據是什麼？→

資料擴增術 Data Augmentation

資料擴增術是一種增加訓練資料多樣性的技術，透過對現有資料進行微小的修改，創造出新的、但仍然代表相同類別的資料點，以提升模型泛化能力。

機器學習深度學習電腦視覺

資料擴增術是什麼？→

資料填補 Data Imputation

資料填補是處理遺失值的方法，透過統計方法估算並替換遺失值，以維持資料完整性，避免分析偏差。

資料處理統計方法機器學習

資料填補是什麼？→

資料洩漏 Data Leakage

資料洩漏（Data Leakage）是指模型訓練過程中，未來或測試集的資訊意外滲入訓練集，導致模型在評估時表現虛高，但部署後實際效能大幅下滑的現象。

模型評估資料處理特徵工程

資料洩漏是什麼？→

資料前處理 Data Preprocessing

資料前處理是指在將原始資料用於機器學習模型之前，對其進行清理、轉換和整合的過程，以提高模型效能和準確性。

機器學習資料處理特徵工程

資料前處理是什麼？→

資料驗證 Data Validation

iPAS

資料驗證是確保機器學習模型訓練與推論資料之準確性、完整性與格式正確性的自動化檢查過程，能有效防止異常數據污染系統。

資料處理特徵工程MLOps

資料驗證是什麼？→

決策樹 Decision Tree

決策樹是一種透過 if-else 條件判斷，將資料逐步拆解為更純粹子集的模型，具備高度可解釋性

機器學習模型訓練特徵工程

決策樹是什麼？→

深度協同過濾 Deep Collaborative Filtering

深度協同過濾結合深度學習與協同過濾，利用神經網路學習使用者和物品的隱藏表示，以提升推薦準確度，尤其在處理複雜互動模式時。

推薦系統深度學習神經網路

深度協同過濾是什麼？→

降維處理 Dimensionality Reduction

降維處理旨在減少資料集的特徵數量，同時保留重要資訊，以簡化模型、加速運算並避免維度災難。

機器學習資料處理特徵工程

降維處理是什麼？→

E

7 個術語

特徵值 Eigenvalue

特徵值是線性變換作用於向量後，該向量長度縮放的比例。它描述了變換對特定方向向量的影響程度。

數學基礎機器學習資料處理

特徵值是什麼？→

特徵向量 Eigenvector

特徵向量是指在線性變換下，方向保持不變或僅反向的非零向量。它對應於特定的特徵值，代表變換的主要作用方向。

數學基礎機器學習電腦視覺

特徵向量是什麼？→

嵌入表示 Embedding

iPAS

嵌入表示將離散的文字或類別映射為連續稠密向量，讓模型能捕捉語義相似性並進行數學運算

自然語言處理特徵工程

嵌入表示是什麼？→

熵 Entropy

熵是資訊理論中衡量隨機變數不確定性的指標，數值越高代表不確定性越大。在機器學習中，熵常用於特徵選擇和決策樹構建。

AI基礎數學基礎統計方法

熵是什麼？→

等寬分箱 Equal-Width Binning

將連續型數值特徵依等距區間分割成有限個離散類別的資料前處理技術。

特徵工程資料前處理離散化

等寬分箱是什麼？→

探索性資料分析 Exploratory Data Analysis

iPAS

在機器學習建模前，透過視覺化與統計方法理解資料特徵、發現模式並檢驗假設的關鍵資料處理步驟。

資料處理特徵工程統計方法

探索性資料分析是什麼？→

極端梯度提升 eXtreme Gradient Boosting

GBDT 的進化版，加入正則化防過擬合，支援缺失值和並行化，是比賽和業界的常勝軍

機器學習模型訓練最佳化

極端梯度提升是什麼？→

F

13 個術語

人臉辨識 Face Recognition

人臉辨識是一種電腦視覺技術，用於自動識別或驗證圖像或影片中的人臉，並與已知人臉資料庫進行比對。

電腦視覺深度學習AI應用

人臉辨識是什麼？→

特徵工程 Feature Engineering

iPAS

特徵工程透過創建、轉換與選擇原始資料的代表性特徵，顯著提升機器學習模型的預測效果

特徵工程資料處理模型訓練高頻

特徵工程是什麼？→

特徵擷取 Feature Extraction

iPAS

特徵擷取是從原始資料中自動識別並提取有意義的特徵表示的過程，目的是降低資料維度同時保留關鍵資訊，提升模型學習效率

特徵工程深度學習降維中頻

特徵擷取是什麼？→

特徵重要性 Feature Importance

量化輸入特徵對機器學習模型預測結果影響程度的指標，用於特徵選擇與模型理解。

特徵工程模型可解釋性特徵選擇

特徵重要性是什麼？→

特徵圖 Feature Map

iPAS

特徵圖是卷積神經網絡中，經過卷積層運算後所產生的多維陣列，用於呈現輸入資料的特定局部特徵與空間結構。

電腦視覺神經網路深度學習

特徵圖是什麼？→

特徵金字塔網路 Feature Pyramid Network

特徵金字塔網路(FPN)是一種用於目標檢測的深度學習架構，旨在從不同尺度的特徵圖中提取豐富的語義信息，以提升小目標的檢測性能。

深度學習電腦視覺神經網路

特徵金字塔網路是什麼？→

特徵縮放 Feature Scaling

特徵縮放是一種資料前處理技術，用於將不同範圍的特徵值縮放到一個統一的範圍內，避免某些特徵主導模型訓練。

機器學習資料處理特徵工程

特徵縮放是什麼？→

特徵選擇法 Feature Selection

特徵選擇是機器學習中選擇最相關特徵子集的過程，旨在簡化模型、提高準確性、減少過擬合和提升模型的可解釋性。

機器學習資料處理特徵工程

特徵選擇法是什麼？→

特徵儲存庫 Feature Store

特徵儲存庫是一個集中管理和共享機器學習特徵的平台，確保特徵一致性、可重用性，並簡化特徵工程流程。

機器學習特徵工程資料處理

特徵儲存庫是什麼？→

特徵轉換 Feature Transformation

將原始特徵通過數學變換或編碼映射為新的特徵表示，以改善機器學習模型的學習效果和泛化能力。

特徵工程資料預處理機器學習

特徵轉換是什麼？→

詐欺偵測 Fraud Detection

AI 詐欺偵測（Fraud Detection）透過機器學習即時分析交易行為，識別異常模式，廣泛應用於銀行信用卡詐欺防範、網路詐騙偵測與保險理賠審核。

異常偵測機器學習AI應用

詐欺偵測是什麼？→

頻率計數 Frequency Count

iPAS

頻率計數是計算特定事件、特徵或字詞在數據集中出現次數的統計方法，為資料分析與機器學習提供基礎特徵。

機器學習自然語言處理特徵工程

頻率計數是什麼？→

頻率編碼 Frequency Encoding

iPAS

將類別特徵轉換為其在資料集中出現的頻率或計數，以捕捉資訊並降低維度。

機器學習資料處理特徵工程

頻率編碼是什麼？→

G

3 個術語

基因表達預測 Gene Expression Prediction

基因表達預測利用機器學習分析DNA序列與生物特徵，以推估細胞中特定基因的轉錄活躍度與產物生成量。

機器學習深度學習AI應用

基因表達預測是什麼？→

泛化能力 Generalization

泛化能力是指機器學習模型在未見過的數據上表現良好的能力。一個具有良好泛化能力的模型能夠從訓練數據中學習到普遍規律，並應用於新數據。

機器學習模型訓練模型評估

泛化能力是什麼？→

梯度提升法 Gradient Boosting

梯度提升法是一種機器學習技術，透過迭代地組合弱學習器（通常是決策樹）來建立強大的預測模型，每次迭代都專注於修正前一個模型的錯誤。

機器學習模型訓練最佳化

梯度提升法是什麼？→

H

4 個術語

異質數據 Heterogeneous Data

由多種不同類型、來源或格式的資料組成，具有高度多樣性和複雜性的資料集合。

多模態AI特徵工程數據融合

異質數據是什麼？→

階層式分群 Hierarchical Clustering

階層式分群（Hierarchical Clustering）是一類無監督學習演算法，透過逐步合併最相似的群組（凝聚法）或分裂群組（分裂法）來建立樹狀結構的群組層次，不需預先指定群數。

機器學習統計方法特徵工程

階層式分群是什麼？→

高維度與高階特徵 High

指特徵空間中的極高維度狀態，或深度學習模型萃取出具備高度抽象、全局觀念與豐富語意的高階向量表示。

機器學習特徵工程資料處理

高維度與高階特徵是什麼？→

高基數特徵 High Cardinality

高基數特徵（High Cardinality）指某個類別型特徵包含大量不同取值的情況，例如用戶 ID、商品 SKU、地理位置等可能有數萬至數百萬種取值，直接進行 One-Hot 編碼會導致維度爆炸，需

特徵工程機器學習資料處理

高基數特徵是什麼？→

I

5 個術語

圖像分類 Image Classification

圖像分類是電腦視覺中的一項任務，旨在將圖像分配到預定義的類別中。模型學習圖像特徵，並基於這些特徵預測圖像所屬的類別。

電腦視覺深度學習模型訓練

圖像分類是什麼？→

圖像識別 Image Recognition

圖像識別是電腦視覺領域的一項任務，旨在識別圖像中的對象、人物、地點或事件。它比圖像分類更廣泛，可能涉及定位和標記圖像中的多個對象。

電腦視覺深度學習模型訓練

圖像識別是什麼？→

啟發網路 Inception Network

Inception Network 是一種深度卷積神經網路架構，旨在透過並行使用多種卷積核大小，捕捉不同尺度的特徵，提升模型效能。

深度學習電腦視覺模型訓練

啟發網路是什麼？→

逆向文件頻率 Inverse Document Frequency

iPAS

逆向文件頻率（IDF）是一種評估詞彙重要性的統計指標，用於降低常見詞彙權重並突顯罕見關鍵字。

自然語言處理特徵工程資料處理

逆向文件頻率是什麼？→

四分位距 IQR

四分位距（Interquartile Range, IQR）是第三四分位數（Q3）與第一四分位數（Q1）的差值，代表資料中間 50% 的分布範圍，常用於穩健的異常值偵測，不受極端值影響。

統計方法資料處理特徵工程

四分位距是什麼？→

L

5 個術語

L1 正則化 L1 Regularization (Lasso)

L1 正則化透過懲罰權重的絕對值總和，驅使模型將不重要特徵的權重歸零，達到特徵選擇的效果

機器學習最佳化特徵工程

L1 正則化是什麼？→

標籤編碼 Label Encoding

標籤編碼是將類別型資料轉換為整數，以便機器學習模型處理，但需注意可能產生不必要的順序關係

資料處理特徵工程機器學習

標籤編碼是什麼？→

機器學習機制 Learning

學習是AI系統從數據中自動提取模式、規律與特徵，藉以提升特定任務效能的核心過程。

機器學習深度學習模型訓練

機器學習機制是什麼？→

對數轉換 Log Transformation

將數值特徵取對數以壓縮偏態分布、縮小量級差距，使數據更接近常態分布的前處理技術。

資料前處理偏態分布特徵工程

對數轉換是什麼？→

留一交叉驗證 LOOCV

留一交叉驗證（Leave-One-Out Cross-Validation, LOOCV）是 K 折交叉驗證的特例，每次將一個樣本作為驗證集，其餘所有樣本作為訓練集，重複執行 N 次（N 為樣本數），

模型評估機器學習統計方法

留一交叉驗證是什麼？→

M

7 個術語

材料科學AI Materials Science AI

材料科學AI運用機器學習加速新材料的發現與設計，能精準預測材料特性並最佳化製程，顯著縮短研發週期。

AI應用機器學習深度學習

材料科學AI 是什麼？→

矩陣分解 Matrix Factorization

矩陣分解是一種將矩陣分解為兩個或多個矩陣乘積的技術，常應用於推薦系統，以預測用戶對未評分項目的偏好。

機器學習推薦系統資料處理

矩陣分解是什麼？→

梅爾頻譜圖 Mel Spectrogram

梅爾頻譜圖是一種音訊訊號的視覺表示，它將音訊的頻率轉換到梅爾尺度上，更符合人類聽覺感知，常用於語音辨識和音訊分析。

語音辨識特徵工程資料處理

梅爾頻譜圖是什麼？→

最小最大值縮放 Min-Max Scaling

將資料線性轉換到指定區間（通常為 [0, 1]）的特徵縮放方法，透過減去最小值再除以值域來實現。

特徵縮放資料前處理正規化

最小最大值縮放是什麼？→

分子圖 Molecular Graphs

分子圖將化學分子抽象為圖形，以節點代表原子、邊緣代表化學鍵，是機器學習處理分子結構的核心格式。

神經網路機器學習特徵工程

分子圖是什麼？→

多任務學習 Multi-task Learning

多任務學習是一種機器學習方法，旨在同時訓練一個模型來執行多個相關任務，以提升模型的泛化能力和效率。

機器學習深度學習模型訓練

多任務學習是什麼？→

互信息 Mutual Information

互信息衡量兩個隨機變數之間相互包含的信息量，數值越大代表相關性越高，常用於特徵選擇、圖像配準等任務。

機器學習特徵工程模型評估

互信息是什麼？→

N

2 個術語

節點嵌入 Node Embedding

節點嵌入是一種將圖形結構中的節點轉換為低維度連續向量的技術，目的是保留節點在原圖中的網絡拓樸與特徵資訊，以便於後續進行各類機器學習任務。

機器學習深度學習知識圖譜

節點嵌入是什麼？→

正規化 Normalization

正規化是一種資料前處理技術，將資料縮放到一個單位範數，例如L1或L2範數，使每個樣本的向量長度為1。

機器學習資料處理特徵工程

正規化是什麼？→

O

3 個術語

獨熱編碼 One-hot Encoding

獨熱編碼是一種將類別資料轉換為二元向量的方法，為每個類別建立獨立欄位，存在時標記為 1，其餘為 0

資料處理特徵工程

獨熱編碼是什麼？→

序數編碼 Ordinal Encoding

將類別型特徵依照其固有順序轉換為整數的編碼方式，保留類別間的大小關係。

特徵工程類別編碼資料預處理

序數編碼是什麼？→

序數特徵 Ordinal Feature

iPAS

一種具有明確順序或等級關係，但數值間距不一定均等的類別型資料。

特徵工程資料處理機器學習

序數特徵是什麼？→

P

3 個術語

事後插補 Post-hoc Imputation

iPAS

事後插補是在模型訓練完成後，於推論階段或生成事後解釋時，即時填補缺失特徵的技術。

資料處理模型評估特徵工程

事後插補是什麼？→

主成分分析 Principal Component Analysis

主成分分析是一種降維技術，藉由找出資料變異最大的方向，將高維度資料投影至低維度空間，以保留關鍵資訊

統計方法特徵工程

主成分分析是什麼？→

屬性預測 Property Prediction

屬性預測是指利用機器學習模型，根據物件的特徵或結構資料，預測其物理、化學或行為特性的技術。

機器學習深度學習特徵工程

屬性預測是什麼？→

R

3 個術語

隨機森林 Random Forest

隨機森林是一種集成學習演算法，透過多棵決策樹投票，以隨機子集資料和特徵進行訓練，提升預測準確性

機器學習模型訓練統計方法

隨機森林是什麼？→

線性整流函數 ReLU

線性整流函數（Rectified Linear Unit, ReLU）是深度學習中最常用的激活函數，將負值輸出設為零、正值保持不變，有效解決梯度消失問題並加速神經網路收斂。

深度學習神經網路模型訓練

線性整流函數是什麼？→

S

9 個術語

稀疏自動編碼器 SAE

一種透過稀疏性約束學習高維資料中可解釋潛在特徵的神經網路架構，近年廣泛應用於語言模型的可解釋性研究。

可解釋性AI稀疏自動編碼器AI安全

稀疏自動編碼器是什麼？→

顯著性地圖 Saliency Map

顯著性地圖是一種圖像處理技術，用於突出顯示圖像中最引人注目的區域。它通過計算每個像素的顯著性得分來實現，得分越高表示該區域越顯著。

電腦視覺機器人學AI應用

顯著性地圖是什麼？→

語意嵌入 Semantic Embedding

iPAS

將文字或概念轉換為連續向量空間中數值表示的技術，讓機器能理解並比較資料間的深層意義關聯與相似度。

自然語言處理機器學習特徵工程

語意嵌入是什麼？→

感測器資料處理 Sensor Data Processing

指將感測器收集的原始訊號，透過濾波、校正與特徵提取，轉化為AI模型可用的結構化數據。

資料處理時序分析異常偵測

感測器資料處理是什麼？→

連體神經網路 Siamese Network

連體神經網路是一種包含兩個或多個共享相同權重的相同神經網路的架構，用於比較輸入之間的相似性或關係。

深度學習神經網路電腦視覺

連體神經網路是什麼？→

奇異值分解 Singular Value Decomposition

奇異值分解（SVD）是一種將矩陣分解為三個矩陣乘積的技術，廣泛應用於降維、推薦系統和資料壓縮等領域。

數學基礎機器學習資料處理

奇異值分解是什麼？→

標準差 Standard Deviation

衡量資料集各數值與平均值之間平均離散程度的統計指標，反映資料的變異性。

統計基礎資料處理特徵工程

標準差是什麼？→

逐步迴歸分析 Stepwise Regression

iPAS

逐步迴歸分析是一種特徵選擇演算法，透過反覆加入或移除自變數，建立預測目標變數的最佳統計模型。

機器學習統計方法特徵工程

逐步迴歸分析是什麼？→

繼任特徵 Successor Features

繼任特徵是強化學習中的一種狀態表徵方法，用於解耦環境動態與獎勵函數，提升多任務學習效率。

強化學習遷移學習特徵工程

繼任特徵是什麼？→

T

5 個術語

目標編碼 Target Encoding

將類別特徵替換為該類別對應的目標變數統計量（通常是條件平均值）的特徵工程技術。

特徵工程類別編碼高基數特徵

目標編碼是什麼？→

目標洩漏 Target Leakage

iPAS

訓練模型時，不小心納入在預測時無法獲取的未來或結果資訊，導致模型過度樂觀。

模型訓練特徵工程模型評估

目標洩漏是什麼？→

TF-IDF Term Frequency-Inverse Document Frequency

衡量一個詞對文件的重要性：在這篇文件中出現多（TF 高）但在其他文件中少見（IDF 高）的詞最重要

自然語言處理特徵工程資料處理

TF-IDF 是什麼？→

文本分類 Text Classification

文本分類是自然語言處理中的一項任務，旨在將文本自動分配到預定義的類別中。它應用廣泛，例如垃圾郵件檢測、情感分析等。

自然語言處理機器學習模型訓練

文本分類是什麼？→

AutoML遷移學習 Transfer Learning for AutoML

AutoML遷移學習利用預訓練模型知識，加速AutoML流程，減少訓練數據需求，提升模型泛化能力，並降低計算成本。

機器學習深度學習AutoML

AutoML遷移學習是什麼？→

特徵工程 相關 AI 術語

啟動圖 Activation Map

錨框 Anchor Box

音訊特徵提取 Audio Feature Extraction

自編碼器 Autoencoder

自動特徵工程 Automated Feature Engineering

詞袋模型 Bag of Words

自助聚合 Bagging

二進位編碼 Binary Encoding

提升算法 Boosting

盒鬚圖 Box Plot

膠囊網路 Capsule Network

類別特徵 Categorical Features

點擊率預測 Click-through Rate Prediction

內容過濾推薦 Content-based Filtering

對比學習 Contrastive Learning

相關矩陣 Correlation Matrix

共變數偏移 Covariate Drift

維度詛咒 Curse of Dimensionality

資料與數據 Data

資料擴增術 Data Augmentation

資料填補 Data Imputation

資料洩漏 Data Leakage

資料前處理 Data Preprocessing

資料驗證 Data Validation

決策樹 Decision Tree

深度協同過濾 Deep Collaborative Filtering

降維處理 Dimensionality Reduction

特徵值 Eigenvalue

特徵向量 Eigenvector

嵌入表示 Embedding

熵 Entropy

等寬分箱 Equal-Width Binning

探索性資料分析 Exploratory Data Analysis

極端梯度提升 eXtreme Gradient Boosting

人臉辨識 Face Recognition

特徵工程 Feature Engineering

特徵擷取 Feature Extraction

特徵重要性 Feature Importance

特徵圖 Feature Map

特徵金字塔網路 Feature Pyramid Network

特徵縮放 Feature Scaling

特徵選擇法 Feature Selection

特徵儲存庫 Feature Store

特徵轉換 Feature Transformation

詐欺偵測 Fraud Detection

頻率計數 Frequency Count

頻率編碼 Frequency Encoding

基因表達預測 Gene Expression Prediction

泛化能力 Generalization

梯度提升法 Gradient Boosting

異質數據 Heterogeneous Data

階層式分群 Hierarchical Clustering

高維度與高階特徵 High

高基數特徵 High Cardinality

圖像分類 Image Classification

圖像識別 Image Recognition

啟發網路 Inception Network

逆向文件頻率 Inverse Document Frequency

四分位距 IQR

L1 正則化 L1 Regularization (Lasso)

標籤編碼 Label Encoding

機器學習機制 Learning

對數轉換 Log Transformation

留一交叉驗證 LOOCV

材料科學AI Materials Science AI

矩陣分解 Matrix Factorization

梅爾頻譜圖 Mel Spectrogram

最小最大值縮放 Min-Max Scaling

分子圖 Molecular Graphs

多任務學習 Multi-task Learning

互信息 Mutual Information

節點嵌入 Node Embedding

正規化 Normalization

獨熱編碼 One-hot Encoding

序數編碼 Ordinal Encoding

序數特徵 Ordinal Feature

事後插補 Post-hoc Imputation

主成分分析 Principal Component Analysis

屬性預測 Property Prediction

特徵工程相關 AI 術語