AI 系統架構 AI System Architecture
iPASAI 系統架構描述 AI 應用的整體技術結構,包含資料層、模型層、服務層的設計,以及雲端、邊緣、混合部署等基礎設施配置
瀏覽 AITerms.tw 中標籤為「iPAS中級」的 AI 術語,快速找到定義、FAQ 與 iPAS 考試重點。
目前篩選:標籤「iPAS中級」,共 67 個術語。
同一術語可隸屬多個主題,因此主題數量會重複計算。
主題標籤
A-Z 快速導覽
目前篩選:標籤「iPAS中級」 ,共 67 個術語
清除篩選 同一術語可隸屬多個主題,因此主題數量會重複計算。
AI 系統架構描述 AI 應用的整體技術結構,包含資料層、模型層、服務層的設計,以及雲端、邊緣、混合部署等基礎設施配置
演算法偏見是指 AI 模型因訓練資料或設計缺陷而產生對特定族群不公平的預測結果,是 AI 治理與負責任 AI 的核心議題
異常偵測是指識別數據集中與預期模式顯著不同的數據點,這些異常點可能指示錯誤、欺詐或其他不尋常的事件。
變異數分析 (ANOVA) 是一種統計方法,用於比較兩個或多個群體的平均數是否存在顯著差異。它將總變異分解為不同來源的變異。
自編碼器是一種神經網路,旨在學習輸入數據的壓縮表示(編碼),然後從該壓縮表示重建原始數據(解碼)。
自動特徵工程利用演算法自動從原始資料中提取、選擇和轉換特徵,以提升機器學習模型的效能。
Bagging (Bootstrap Aggregating) 是一種集成學習技術,透過對原始資料集進行多次有放回的抽樣,訓練多個模型,並將它們的預測結果進行平均或投票。
貝氏定理描述在已知一些條件下,事件發生的機率。它基於先驗機率、條件機率和證據,更新對事件的信念。
貝氏最佳化是一種用於最佳化黑盒函數的演算法,它使用貝氏模型來建立目標函數的代理模型,並利用該模型來選擇下一個要評估的點,以在最少的迭代次數內找到最佳解。
大數據指規模龐大、速度快速且多樣化的資料集合,傳統資料處理工具難以有效處理,需要專門的技術與架構來儲存、分析與應用
Boosting 是一種集成學習技術,透過迭代訓練一系列弱學習器,每個學習器都試圖糾正前一個學習器的錯誤,最終將它們組合起來形成一個強學習器。
膠囊網路是一種神經網路架構,旨在解決卷積神經網路在處理物件方向和空間關係上的不足,透過膠囊和路由機制,更有效地捕捉物件的層次結構。
卡方檢定是一種統計方法,用於檢驗兩個或多個類別變數之間是否存在顯著關聯性。它比較觀察值與期望值之間的差異。
協同過濾是一種推薦系統技術,透過分析使用者行為或偏好,預測使用者可能感興趣的項目,例如商品、電影或音樂。
容器化技術是一種將應用程式及其所有依賴項打包到一個可移植容器中的技術,實現跨環境一致的部署。
成本效益分析是評估 AI 專案投資回報的方法,計算直接節省成本加上間接效益後,扣除導入與維運成本,以判斷專案是否值得執行
資料不平衡指訓練資料中各類別樣本數量差異懸殊,導致模型傾向預測多數類別,常用 SMOTE 過採樣或欠採樣等技術來處理
資料填補是處理遺失值的方法,透過統計方法估算並替換遺失值,以維持資料完整性,避免分析偏差。
資料標註是指為原始資料添加標籤的過程,這些標籤提供關於資料的額外資訊,用於訓練監督式機器學習模型。
資料並行是一種分散式訓練方法,將資料分割成多份,分配給多個節點,每個節點使用相同模型副本訓練不同資料子集。
資料管線是一系列資料處理步驟,將原始資料轉換為可供分析或模型使用的格式,包含擷取、轉換、載入等階段。
資料前處理是指在將原始資料用於機器學習模型之前,對其進行清理、轉換和整合的過程,以提高模型效能和準確性。
資料隱私是指保護個人資訊不被未授權存取、蒐集或濫用的原則與實踐,在 AI 系統中需遵循 PDPA 等法規要求
資料視覺化是將資料轉換為圖表、圖形等視覺形式的技術,幫助人們更直觀地理解資料模式、趨勢與異常,常用工具包括 Matplotlib、Tableau、Power BI
深度Q網路(DQN)是一種結合深度學習與Q學習的強化學習演算法,利用深度神經網路逼近Q函數,解決高維度狀態空間的強化學習問題。
描述性統計使用數值摘要(平均數、中位數、標準差等)和圖表來描述資料集的集中趨勢、離散程度與分佈型態,是資料分析的第一步
降維處理旨在減少資料集的特徵數量,同時保留重要資訊,以簡化模型、加速運算並避免維度災難。
判別式 AI 學習輸入與輸出之間的條件機率 P(Y|X),直接預測分類或回歸結果,與生成式 AI 學習資料分佈 P(X) 相對
分散式訓練利用多個計算節點,將模型訓練任務分割並行處理,加速大型模型訓練,提升效率。
集成學習透過結合多個弱學習器,建立一個強學習器,以提高模型的準確性和泛化能力,常見方法包括Bagging、Boosting和Stacking。
期望最大化 (EM) 算法是一種迭代算法,用於在存在隱變量的情況下,估計機率模型的參數。它交替執行期望 (E) 步驟和最大化 (M) 步驟。
梯度爆炸是指在深度學習模型訓練中,梯度在反向傳播時變得異常巨大,導致權重更新過大,模型訓練不穩定甚至崩潰。
特徵擷取是從原始資料中自動識別並提取有意義的特徵表示的過程,目的是降低資料維度同時保留關鍵資訊,提升模型學習效率
特徵縮放是一種資料前處理技術,用於將不同範圍的特徵值縮放到一個統一的範圍內,避免某些特徵主導模型訓練。
特徵選擇是機器學習中選擇最相關特徵子集的過程,旨在簡化模型、提高準確性、減少過擬合和提升模型的可解釋性。
前饋神經網路是一種訊息單向傳播的神經網路,由輸入層、隱藏層和輸出層組成,廣泛應用於分類和迴歸任務。
閘控循環單元(GRU)是一種循環神經網路(RNN)的變體,旨在解決傳統RNN的梯度消失問題,更有效地捕捉長期依賴關係。
生成式 AI 是能夠產生新內容(文字、圖像、音訊、程式碼等)的人工智慧系統,基於學習大量訓練資料的分佈特徵來生成符合語境的輸出
基因演算法是一種模擬生物進化過程的優化算法,通過選擇、交叉和突變等操作,逐步演化出更優的解,用於解決複雜的搜索和優化問題。
圖形處理器(GPU)是一種專為並行處理設計的電子電路,最初用於加速圖像渲染,現廣泛應用於深度學習等需要大量計算的領域。
梯度提升法是一種機器學習技術,透過迭代地組合弱學習器(通常是決策樹)來建立強大的預測模型,每次迭代都專注於修正前一個模型的錯誤。
網格搜尋是一種超參數調校方法,它窮舉超參數空間中所有可能的組合,並評估每個組合的模型效能。
最大似然估計 (MLE) 是一種統計方法,用於估計機率分佈的參數,它通過最大化觀察到樣本數據的似然函數來實現。
將資料線性轉換到指定區間(通常為 [0, 1])的特徵縮放方法,透過減去最小值再除以值域來實現。
語言模型處理序列時用於表示遮蔽或缺失位置的特殊符號,常見於遮罩語言模型訓練與填空推論任務。
混合精度訓練是一種使用不同精度(如 FP16 和 FP32)的浮點數進行模型訓練的技術,旨在加速訓練過程並減少記憶體佔用。
模型平行化是一種將大型模型分割到多個裝置上進行訓練或推論的技術,以克服單一裝置的記憶體限制。
模型登錄庫是集中管理 AI 模型版本、追蹤訓練紀錄與部署狀態的系統,如同模型的戶籍系統
多模態 AI 能同時處理並整合多種類型的輸入資料(文字、圖像、聲音、影片等),產生跨模態的理解與輸出
半監督學習是一種機器學習方法,它結合了少量標記資料和大量未標記資料進行模型訓練,旨在利用未標記資料提升模型效能,降低標記成本。
評估非監督式分群品質的指標,衡量每個樣本與所屬群集的緊密程度相對於鄰近群集的分離程度,數值範圍為 -1 到 1。
隨機梯度下降(SGD)是一種迭代優化算法,用於最小化目標函數。它每次迭代僅使用一個或少量樣本計算梯度,加速訓練過程,但可能導致收斂不穩定。