ACID原則 ACID
iPAS確保資料庫交易可靠執行的四個基本屬性:原子性、一致性、隔離性與持久性,是資料處理的重要基礎。
瀏覽 AITerms.tw 中標籤為「source:ipas」的 AI 術語,快速找到定義、FAQ 與 iPAS 考試重點。
目前篩選:標籤「source:ipas」,共 123 個術語。
同一術語可隸屬多個主題,因此主題數量會重複計算。
主題標籤
A-Z 快速導覽
目前篩選:標籤「source:ipas」 ,共 123 個術語
清除篩選 同一術語可隸屬多個主題,因此主題數量會重複計算。
確保資料庫交易可靠執行的四個基本屬性:原子性、一致性、隔離性與持久性,是資料處理的重要基礎。
啟動圖是卷積神經網路中,輸入資料經過卷積與啟動函數處理後所輸出的多維度特徵矩陣。
調整蘭德指數用於評估分群演算法,透過修正隨機偏差,客觀衡量分群結果與真實標籤間的相似程度。
衡量模型在面對惡意擾動輸入時的性能,評估其魯棒性與安全性。
對抗性去偏見是一種利用對抗性訓練減少機器學習模型預測中固有偏見的技術,確保演算法的公平性。
一種在分散式系統中進行資料聚合與同步的通訊操作,確保所有計算節點最終獲得完全相同的整合結果。
注意力崩潰指深度神經網路的注意力權重趨向一致,導致模型無法有效區分輸入特徵的現象。
注意力圖是注意力機制的內部權重視覺化表示,呈現模型在處理序列資料時,各個元素之間的相互關注程度與依賴關係。
模擬真實情境以測試和評估AI系統的安全性、合規性與應變能力,識別潛在弱點。
巴丹瑙注意力允許序列模型在解碼時動態聚焦於相關的輸入特徵,有效克服長序列造成的資訊遺失問題。
雙向語境是同時參考目標元素前後文資訊的技術,能大幅提升模型對整體脈絡與語意的理解精準度。
在單一時間點將新系統或模型同時發布給所有使用者,瞬間取代舊系統的部署策略。
將類別特徵映射為整數,再將這些整數轉換為其二進位表示的特徵工程方法。
指從開始到完成AI模型或軟體專案建置過程所需的時間。
衡量AI模型或軟體專案建置過程中失敗次數佔總次數的比例。
撤銷已發行但因故不再信任的數位憑證,防止其被濫用,確保AI系統安全與信任鏈完整性。
在模型訓練過程中定期儲存模型狀態與權重的技術,可防止意外中斷導致進度遺失,並便於後續推論或微調。
類別權重是一種機器學習技術,透過賦予少數類別較高權重來解決資料不平衡問題,提升模型對稀有事件的預測能力。
衡量數學問題或演算法對輸入微小變化的敏感程度。
持續整合設計是規劃自動化流程,頻繁整合程式碼、建構與測試,旨在提升軟體開發效率與品質。
持續驗證是主動且持續地測試複雜系統的工程實踐,旨在確保模型與基礎設施在正式環境中始終符合預期的效能、穩定性與安全標準。
一種機器學習技術,透過拉近相似樣本的特徵並推開相異樣本,使模型能學習到更具區別性與對齊性的特徵空間。
卷積運算是提取特徵的數學操作,透過濾波器在資料上滑動捕捉邊緣與紋理,廣泛應用於電腦視覺領域。
共變數偏移是指機器學習模型在訓練與推論階段,輸入特徵的資料分佈發生改變,但給定特徵下的目標變數條件分佈保持不變的現象。
創用CC提供彈性版權許可,讓創作者分享作品,同時保留部分權利,促進知識共享與再利用。
描述資料集來源、組成、預期用途、限制與潛在偏誤的文件。
將大規模資料集水平切割為多個獨立區塊,以提升平行處理效率與降低記憶體負荷。
資料驗證是確保機器學習模型訓練與推論資料之準確性、完整性與格式正確性的自動化檢查過程,能有效防止異常數據污染系統。
資料版本控制是一種管理機器學習專案中資料集與模型異動的技術,確保實驗的可重複性與團隊協作效率。
僅解碼器模型是一種專注於自迴歸生成的架構,透過預測下一個詞彙來產生連續文本,為現代語言模型的核心。
指感測器或裝置隨時間產生資料分佈變化的現象,影響模型效能。
透過收集設備或用戶的多種可識別資訊,建立獨特且穩定的識別碼。
直接侵權指未經授權而直接複製、散布或使用受版權保護作品的行為,在AI領域涉及模型訓練與輸出。
隨機失活遮罩在訓練時動態產生隨機二元矩陣,將部分神經元輸出暫時歸零,以打破特徵依賴並防止模型過度擬合。
邊緣裝置指位於網路邊緣、靠近資料生成源頭的硬體設備,能在本地端直接執行資料處理與 AI 模型推論任務。
嵌入矩陣是深度學習中將離散變數映射為連續稠密向量的權重矩陣,能有效捕捉詞彙或特徵間的語意與結構關聯性。
在機器學習建模前,透過視覺化與統計方法理解資料特徵、發現模式並檢驗假設的關鍵資料處理步驟。
當使用者對領域不熟悉、目標模糊時,透過反覆查詢與學習來釐清資訊需求並獲取新知的資訊檢索過程。
機器學習公平性旨在確保人工智慧系統決策的客觀與公正,防止演算法因使用者的種族、性別或年齡等受保護特徵而產生系統性的偏見與歧視。
機器學習中,輸入資料的特徵分佈隨時間變化的現象,可能導致模型性能下降。
一種在不改變程式碼的情況下,動態啟用或停用系統功能與機器學習模型的工程技術。
特徵圖是卷積神經網絡中,經過卷積層運算後所產生的多維陣列,用於呈現輸入資料的特定局部特徵與空間結構。
允許在不重新部署程式碼的情況下,動態開啟或關閉特定功能,便於A/B測試與風險管理。
頻率計數是計算特定事件、特徵或字詞在數據集中出現次數的統計方法,為資料分析與機器學習提供基礎特徵。
將類別特徵轉換為其在資料集中出現的頻率或計數,以捕捉資訊並降低維度。
驗證AI模型或系統在特定輸入下行為是否符合預期功能的過程。
高斯雜訊是一種機率密度符合常態分佈的隨機干擾訊號,數值多集中於平均值,常應用於資料擴增與生成模型中。
生成分佈是指生成式人工智慧模型在給定隨機噪聲或潛在變數後,所產生的合成資料在特徵空間中呈現的機率分佈。
梯度懲罰是用於穩定生成對抗網路的正則化技術,透過限制梯度範數以確保模型平滑,能防止模式崩潰。
在分散式機器學習中,匯總多個運算節點的梯度以確保模型參數一致更新的過程。
真實邊界框是電腦視覺模型訓練與評估中,由人工標註的正確物件位置範圍,作為衡量預測結果的基準標準。
隱藏狀態是神經網路中用於儲存與傳遞歷史資訊的內部記憶向量,負責在處理序列資料時保留上下文特徵,協助模型理解時序依賴關係。
根據資源使用率自動增減 Kubernetes 叢集中 Pod 數量的機制,確保應用效能並最佳化資源配置。
透過增加更多節點或機器來擴展系統處理能力,以應對AI工作負載增長。
Hugging Face 提供開源機器學習模型與資料集託管,協助開發者協作、分享並快速部署各類人工智慧應用。
假設性文件嵌入是一種檢索技術,透過語言模型先生成假設解答,再將該解答轉為向量以搜尋真實文件。
透過對比正負樣本,最大化互資訊下界的損失函數,主要用於自監督表徵學習。
內積是計算兩向量相似度與投影關係的數學運算。在機器學習中用於衡量特徵相關性,為神經網路的核心基礎。
探索不足是指代理人過早專注於已知的高回報行為,未充分嘗試其他未知行為,導致陷入局部最佳解的現象。
整合地獄是指在系統開發與機器學習專案中,將各自獨立開發的模組或模型進行合併時,因依賴衝突而引發的嚴重錯誤與發布延遲。
逆向文件頻率(IDF)是一種評估詞彙重要性的統計指標,用於降低常見詞彙權重並突顯罕見關鍵字。
迭代反向翻譯是一種自然語言處理技術,透過將目標語言翻譯回來源語言生成合成平行語料,並反覆交替訓練正反向模型以提升翻譯品質。
版本控制系統中主要的開發線路,通常包含穩定且可發布的程式碼。
一種統計假設,主張系統在給定當前狀態下,未來的演變與過去歷史狀態相互獨立,即未來只取決於現在。
一種衡量兩個機率分佈之間差異的統計距離,常用於生成模型評估與領域適應。
衡量系統或組件從故障到完全修復所需的平均時間,是可靠性工程關鍵指標。
記憶率衡量AI模型對訓練資料中特定樣本的過度記憶程度,可能導致隱私洩露或泛化能力差。
指多模態模型在部分輸入資料(如影像或音訊)缺失或損壞時,仍能維持穩定預測效能與系統運作的能力。
混合正則化是一種透過組合兩個或多個訓練樣本及其標籤來生成新訓練數據的技術,藉此擴增資料集多樣性,有效減輕神經網路模型的過擬合現象並提升泛化能力。
這是一個測試用的短定義,長度超過二十個字元以符合 lint 規則的要求,這樣才能成功推進。
概述AI模型性能、限制、預期用途、評估指標與潛在風險的文件。
模型評估是衡量機器學習模型在未知資料上表現的過程,透過特定指標來確保模型的泛化能力與實用性。
模型參數是機器學習模型從資料中學習到的內部數值變數,包含權重與偏差,主要決定模型如何產生預測結果。
一種在連續影像中偵測並識別多個移動物件,持續賦予穩定追蹤編號與軌跡預測的電腦視覺分析技術。
一種整合實例分割與語義分割的神經網路架構,透過特徵金字塔網路同時處理前景物件與背景環境的高效模型。
深度學習模型中用於同時執行語義與實例分割的模組。
全景品質是評估全景分割同時辨識物件與分割區域是否正確的綜合指標。
一種分散式機器學習架構,專門負責儲存與更新全域模型參數,並與多個工作節點進行通訊與資料同步。
持久化儲存卷是在容器化環境中獨立於容器生命週期的儲存資源,能確保系統或任務重啟時資料不會遺失。
階段性發布是一種將新版人工智慧模型或軟體功能逐步推送給使用者的部署策略。透過分階段增加流量比例,團隊能在全面上線前,於真實環境中監控效能並控制潛在風險。
策略崩潰是強化學習中因參數更新過度,導致行為迅速退化成單一無效模式的現象,嚴重破壞訓練穩定性。
事後插補是在模型訓練完成後,於推論階段或生成事後解釋時,即時填補缺失特徵的技術。
透過自動化演算法從多語言文本中萃取或合成的高語義相似度句子對集合,主要用於緩解跨語言任務中的資料稀缺問題。
隨機遮蔽是隱藏部分資料的自監督技術,迫使模型從剩餘資訊推斷缺失內容,以提升特徵提取與泛化能力。
一種控制請求頻率的機制,防止系統過載或濫用,確保服務穩定性與資源公平分配。
真實分佈是指母體資料在客觀現實中的機率分佈狀態,是機器學習與統計模型致力於逼近與學習的終極目標。
倒數排名融合是一種無需依賴絕對分數的結果融合技術。它透過計算文件在多個獨立檢索系統中排名的倒數並進行加總,藉此產生綜合多方結果的最終排名。
衡量AI系統在理解和識別輸入資料(如圖像、語音、文本)時的準確性與可靠性。高辨識品質是確保模型效能和應用成功的關鍵。
每秒請求數 (RPS) 衡量系統每秒處理請求量,是評估 AI 模型部署與 API 服務效能的關鍵指標。
滾動更新是一種軟體部署策略,透過逐步替換舊版實例為新版實例,確保系統在升級期間保持零停機,維持服務的高可用性。
水平擴展是透過增加伺服器節點來分散系統負載的架構策略,常用於提升模型部署與分散式運算的處理能力。
透過計算查詢與鍵的點積並進行縮放,以決定序列中特徵間的關聯權重,是提取上下文資訊的關鍵深度學習機制。
識別並映射不同資料源之間語義等效的資料元素,以實現資料整合與互通。
衡量圖像分割任務中預測區域與真實區域重疊程度的指標。
將文字或概念轉換為連續向量空間中數值表示的技術,讓機器能理解並比較資料間的深層意義關聯與相似度。
語義空間是將詞彙、句子或文件轉換為多維連續向量的數學模型,使電腦能計算語言的意義相似度與深層關聯。
一種廣泛使用的密碼學雜湊函數,將任意長度資料轉換為固定256位元雜湊值。
影子模式是指將新模型部署於生產環境,接收真實流量並進行預測,但預測結果不影響實際業務決策的評估策略。
將不同模態資料映射到同一向量空間,使它們可相互比較與理解。
稀疏變換器是一種深度學習架構,透過限制注意力機制的計算範圍降低複雜度,使其能高效處理長序列資料。
稀疏性約束是一種在機器學習中,強制模型參數或內部表示包含更多零值的正則化技術,以降低運算成本。
拼寫校正是一種自動偵測並修正文本中拼寫錯誤的技術,旨在提高資料品質、增強搜尋精準度與改善使用者體驗。
逐步迴歸分析是一種特徵選擇演算法,透過反覆加入或移除自變數,建立預測目標變數的最佳統計模型。
訓練模型時,不小心納入在預測時無法獲取的未來或結果資訊,導致模型過度樂觀。
指引AI模型生成內容的文字指令或問題,是與生成式AI互動的核心方式。
為降低自注意力複雜度的技術。透過僅保留分數最高的前 K 個鍵值對參與計算,有效減少記憶體與運算開銷。
截斷技巧是一種在生成式模型中,透過限制潛在向量採樣範圍來提升生成品質的策略,主要用多樣性來換取更高的影像或資料保真度。