A/B測試 A/B Testing
A/B測試是一種隨機實驗方法,用於比較兩個版本的變數(A 和 B),以確定哪個版本表現更好。常用於優化使用者體驗和提升轉換率。
查詢 Transformer、RAG、AI Agent 等 AI 術語,包含定義、iPAS 考點分析、常見問題與 Markdown 版本。
AITerms.tw 收錄了 1120 個結構化的 AI 術語定義,每個術語包含精準定義、iPAS 考試出題分析、常見問題和 Markdown 版本供 AI 引擎讀取。
同一術語可隸屬多個主題,因此主題數量會重複計算。
主題標籤
A-Z 快速導覽
A/B測試是一種隨機實驗方法,用於比較兩個版本的變數(A 和 B),以確定哪個版本表現更好。常用於優化使用者體驗和提升轉換率。
透過逐一移除模型的組成元件來衡量各元件對整體性能貢獻的實驗方法,廣泛用於驗證架構設計決策。
摘要生成技術利用AI理解原文,並以新的句子和詞彙生成摘要,更接近人類的摘要方式,但實現難度較高。
所有預測中正確的比例 = (TP+TN)/(全部)。類別不平衡時容易被多數類主導
確保資料庫交易可靠執行的四個基本屬性:原子性、一致性、隔離性與持久性,是資料處理的重要基礎。
ACID 是指資料庫交易必須具備原子性、一致性、隔離性與持久性四大特性,以確保資料處理的正確性、可靠性與完整性。
在語音識別、語音合成等任務中,建立音訊特徵與語言單位(音素、詞彙)對應關係的機器學習模型。
能夠感知環境、規劃並執行工具呼叫或外部操作的 AI 模型,是 AI Agent 系統的核心組成。
從視頻中識別和分類人體或物體執行的動作,將視頻片段分配給預定義的動作類別。
在反向傳播時重新計算隱藏層激活值而非存儲,交換計算時間換取記憶體空間,使訓練更大模型成為可能。
神經網路中賦予模型非線性表達能力的函數,使深度網路能學習複雜非線性模式。
啟動圖是卷積神經網路中,輸入資料經過卷積與啟動函數處理後所輸出的多維度特徵矩陣。
一種機器學習策略,由演算法主動選擇最具訊息價值的未標籤樣本進行標籤,以最小化標籤成本並最大化模型性能
演員-評論家是一種強化學習演算法,結合了策略梯度(演員)和時序差分學習(評論家)的優點,以實現更穩定的學習。
透過動態調整樣本權重,使後續模型專注於前面模型的分類錯誤的經典 Boosting 演算法。
根據過去梯度的平方和自動調整各參數學習率的最佳化演算法,使高頻參數學習率較小,低頻參數學習率較大。
適配器模組是一種輕量級的模型微調方法,透過在預訓練模型中插入少量可訓練參數,以適應特定任務,同時保持原始模型參數凍結。
調整蘭德指數用於評估分群演算法,透過修正隨機偏差,客觀衡量分群結果與真實標籤間的相似程度。
衡量模型在面對惡意擾動輸入時的性能,評估其魯棒性與安全性。
對抗性攻擊是指通過對輸入數據進行微小且不易察覺的修改,使AI模型產生錯誤輸出的攻擊方式,用於測試模型的魯棒性。
對抗性去偏見是一種利用對抗性訓練減少機器學習模型預測中固有偏見的技術,確保演算法的公平性。
透過微小擾動特意設計的輸入,能使經過訓練的 AI 模型產生錯誤預測的輸入樣本
對抗性穩健是指機器學習模型在面對惡意設計的對抗樣本時,仍能維持其預測準確性的能力,抵抗攻擊。
自主系統對抗韌性旨在確保AI驅動的自主系統,如自駕車或機器人,在面對惡意干擾或對抗性攻擊時,仍能維持其預期功能與安全性,避免錯誤決策或系統失效。
一種透過引入具有對抗特性的數據樣本來強化模型穩健性的機器學習訓練方法,能夠提升模型在面對惡意攻擊或分佈外輸入時的防禦能力。
具備自主感知環境、做出決策並執行相應動作以達成特定目標的智慧型軟體實體。
由一個或多個能自主感知環境、做出決策並採取行動以達成目標的 AI 代理人所組成的計算架構。
AI 代理是能自主規劃、執行任務並運用工具的 AI 系統,它不只回答問題,更能實際採取行動
人工智慧倫理旨在探討並解決AI系統開發、部署和使用過程中涉及的道德、法律和社會問題,確保AI的發展符合人類價值觀。
確保 AI 系統對不同群體(如性別、種族、年齡)的決策結果不存在不合理歧視或偏差的原則與實踐。
AI治理是指建立一套框架和流程,以確保AI系統的開發和使用符合倫理、法律和社會價值觀。
人工智慧監管是指政府或相關機構制定和實施的,旨在規範人工智慧技術開發、部署和使用的法律、政策和指導方針,以確保其安全、公平和符合倫理。
人工智慧風險評估是一種識別、分析和評估人工智慧系統可能造成的潛在風險的過程,旨在了解風險的性質、可能性和影響,並制定相應的應對措施。
人工智慧安全旨在確保AI系統在部署後,其行為符合人類意圖,避免產生意外或有害的後果,保障人類福祉。
AI沙盒是一個受控的環境,用於測試和評估AI系統,而無需擔心對真實世界產生負面影響。它提供了一個安全可靠的實驗平台。
AI 系統架構描述 AI 應用的整體技術結構,包含資料層、模型層、服務層的設計,以及雲端、邊緣、混合部署等基礎設施配置
AI浮水印是一種將資訊嵌入AI模型或其產生的內容中的技術,用於驗證來源、追蹤使用情況或防止未經授權的複製。
將代數結構(如群、環、格等)引入注意力機制設計,以捕捉資料中具有代數對稱性或層次結構的關係。
演算法是一組定義明確的指令,用於解決特定問題或執行特定任務。它接收輸入,經過一系列步驟處理,並產生輸出。
演算法問責制指確保人工智慧與自動化系統之設計、開發及部署過程具備透明度、公平性及可解釋性,並在產生損害時明確劃分相關責任歸屬的機制。
演算法偏見是指 AI 模型因訓練資料或設計缺陷而產生對特定族群不公平的預測結果,是 AI 治理與負責任 AI 的核心議題
演算法交易是指利用電腦程式自動執行交易指令,根據預先設定的規則和模型,在金融市場上進行買賣操作。
一種相對位置編碼方法,通過在注意力分數中添加位置相關的線性偏置項,實現相對位置編碼且具有優秀的外推性能。
對齊校準是指使AI模型,特別是大型語言模型,的行為與人類意圖、價值觀和倫理規範相符的過程,降低潛在風險。
模型在對齊(使其行為符合人類價值觀)過程中可能損失的性能,特別是在某些原始能力上的下降。
一種在分散式系統中進行資料聚合與同步的通訊操作,確保所有計算節點最終獲得完全相同的整合結果。
指代消解是自然語言處理中的一項任務,旨在確定文本中代詞或其他指稱語所指代的先行詞,以理解文本的完整含義。
錨框(Anchor Box)是在目標檢測中預先定義的一系列具有不同大小和長寬比的矩形框,用於在圖像中生成候選區域,以便模型進行目標分類和邊界框回歸。
異常偵測是指識別數據集中與預期模式顯著不同的數據點,這些異常點可能指示錯誤、欺詐或其他不尋常的事件。
變異數分析 (ANOVA) 是一種統計方法,用於比較兩個或多個群體的平均數是否存在顯著差異。它將總變異分解為不同來源的變異。
反洗錢人工智慧(AML AI)利用AI技術自動偵測金融交易中的可疑活動,協助金融機構遵守法規,打擊洗錢犯罪。
API閘道是位於應用程式前端的伺服器,作為單一入口點處理所有API請求,提供路由、驗證、授權、限流、監控等功能。
衡量分類模型在不同閾值下的綜合表現,AUC=1 完美,AUC=0.5 等於隨機猜
ARIMA是一種廣泛使用的時間序列預測模型,結合了自迴歸、差分和移動平均三個部分,用於分析和預測時間序列資料。
通用人工智慧(AGI)是指具備與人類同等或超越人類的智慧,能夠理解、學習、適應並在任何智力任務中表現出色的AI系統。
人工智慧是模擬人類認知能力的電腦技術,透過機器學習與深度學習讓系統能自主學習與決策
分析文本對特定方面或話題的情感態度,而非整體情感,如評論中對產品外觀、性能的分別評價。
將人類口語音頻訊號自動轉換為文字的技術,是語音 AI 的基礎元件,廣泛應用於語音助理、會議記錄、字幕生成等場景。
注意力崩潰指深度神經網路的注意力權重趨向一致,導致模型無法有效區分輸入特徵的現象。
注意力圖是注意力機制的內部權重視覺化表示,呈現模型在處理序列資料時,各個元素之間的相互關注程度與依賴關係。
注意力機制讓神經網路在處理序列資料時,動態分配不同位置的關注權重,提升長距離依賴的捕捉能力
一種深度學習技術,使模型能動態權衡時間序列中不同時間步的重要性,以捕捉長期依賴關係和關鍵模式。
注意力可視化是一種技術,用於呈現神經網路模型在處理輸入時,將注意力集中在哪些部分。它能幫助理解模型決策過程,並診斷潛在問題。
AUC(曲線下面積)是一種模型評估指標,用於衡量二元分類模型區分正負樣本的整體能力,值介於0到1之間,越高代表性能越好。
從原始音訊訊號中自動計算或學習具有代表性的低維特徵向量,用於後續機器學習任務。
利用音頻和視覺信息的相關性,訓練神經網絡進行特徵學習的方法,通常不需要人工標籤。
模擬真實情境以測試和評估AI系統的安全性、合規性與應變能力,識別潛在弱點。
在語言模型生成過程中整合外部知識來源或工具,以提升生成內容的準確性、時效性與可信度的技術框架。
評估 RAG 系統輸出品質的方法論,量化模型在檢索增強場景下的忠實性、相關性和答案完整性。
自動擴展根據系統負載自動調整計算資源,動態增加或減少伺服器數量,確保應用程式效能,同時優化成本。
自編碼器是一種神經網路,旨在學習輸入數據的壓縮表示(編碼),然後從該壓縮表示重建原始數據(解碼)。
自動特徵工程利用演算法自動從原始資料中提取、選擇和轉換特徵,以提升機器學習模型的效能。
透過自動化方式完成機器學習管線中資料前處理、特徵工程、模型選擇與超參數調整等步驟的技術框架。
自動駕駛技術利用感測器、人工智慧和控制系統,使車輛能夠在沒有人為干預的情況下感知環境並自主導航。
自主系統是指能在沒有外部干預下,感知環境、做出決策並執行動作的系統,具備一定程度的獨立性和適應性。
自駕車是指無需人類駕駛員干預,能自主感知環境、做出決策和控制行駛的車輛。自駕系統整合了計算機視覺、傳感器融合、路徑規劃和深度學習,是 AI 應用中最複雜的系統。
依序根據前面所有輸出預測下一個元素的生成式模型架構。
後門攻擊是一種針對機器學習模型的惡意攻擊,攻擊者在模型中植入後門,使其在特定觸發條件下產生預設的錯誤輸出。
詞袋模型是一種簡化文本表示的方法,忽略詞語的順序和語法結構,僅統計每個詞語在文本中出現的次數,形成詞頻向量。
Bagging (Bootstrap Aggregating) 是一種集成學習技術,透過對原始資料集進行多次有放回的抽樣,訓練多個模型,並將它們的預測結果進行平均或投票。
巴丹瑙注意力允許序列模型在解碼時動態聚焦於相關的輸入特徵,有效克服長序列造成的資訊遺失問題。
批次推論是指將大量資料一次性輸入模型進行預測,適用於對延遲不敏感的場景,例如定期報表生成或離線資料分析。
批次正規化是一種標準化技巧,針對每層網路的輸入進行調整,使訓練過程更穩定,並允許使用較大的學習率
將大量資料或任務累積後一次性集中執行的計算模式,與即時處理相對。
批次大小是訓練時每次更新模型參數所使用的樣本數,直接影響訓練速度、記憶體用量與模型收斂穩定性
低功耗機器學習是一種專注於減少模型推論時能源消耗的技術,旨在延長行動裝置與邊緣設備的電池續航力。
貝氏定理描述在已知一些條件下,事件發生的機率。它基於先驗機率、條件機率和證據,更新對事件的信念。
用有向無環圖與條件機率表表示變數間依賴關係的概率圖模型,支援推論與學習。
貝氏最佳化是一種用於最佳化黑盒函數的演算法,它使用貝氏模型來建立目標函數的代理模型,並利用該模型來選擇下一個要評估的點,以在最少的迭代次數內找到最佳解。
集束搜尋是一種啟發式搜尋演算法,用於序列預測任務,它在每個時間步保留多個最有可能的候選序列(集束),而非僅僅選擇最佳選項。
行為預測是機器學習技術,透過分析歷史數據,識別模式,進而預測個體或群體的未來行為,應用於推薦、風險管理等。
在圖模型上透過相鄰節點間訊息的迭代交換,計算邊際分布與進行機率推論的演算法。
模型基準測試是一套標準化的評估任務與資料集,用來客觀衡量並比較不同 AI 模型的各項性能與實際能力。
基準測試是用於評估和比較不同AI模型、演算法或系統性能的標準化方法,提供客觀的性能指標。
BERT是一種基於Transformer架構的雙向編碼器模型,用於理解文本的語義和上下文,廣泛應用於自然語言理解任務。
偏差是模型對特定族群或特徵產生系統性錯誤傾向,源自訓練資料不平衡或演算法設計缺陷
偏見偵測旨在識別AI資料或演算法中對特定群體的歧視性偏差,是確保系統公平性與可信度的關鍵步驟。
AI偏見是指AI系統在訓練或決策過程中,由於資料、演算法或人為因素,產生不公平或歧視性的結果。
識別和減少機器學習模型中存在的各種偏見,確保 AI 系統的公平性和非歧視性
偏差方差權衡是指在模型訓練中,降低偏差會增加方差,反之亦然。目標是找到一個平衡點,使模型在未見過的數據上表現良好。
雙向語境是同時參考目標元素前後文資訊的技術,能大幅提升模型對整體脈絡與語意的理解精準度。
能同時處理序列的前向和後向上下文,在每個位置都能看到完整序列信息的神經網路編碼器,相比單向模型提供更豐富的上下文表示,是 BERT 等預訓練模型的核心。
Google 的雙向語言模型,用 MLM(遮罩)和 NSP 預訓練,擅長理解文本語意
在單一時間點將新系統或模型同時發布給所有使用者,瞬間取代舊系統的部署策略。
大數據指規模龐大、速度快速且多樣化的資料集合,傳統資料處理工具難以有效處理,需要專門的技術與架構來儲存、分析與應用
雙語評估替代指標(BLEU,Bilingual Evaluation Understudy)是機器翻譯品質評估的自動化量化指標,透過比對機器翻譯輸出與人工參考譯文中 n-gram 的重疊程度,給出 0
機器學習任務的一種,目標是將輸入樣本判斷為兩個互斥類別之一(如是/否、正常/異常)。
將類別特徵映射為整數,再將這些整數轉換為其二進位表示的特徵工程方法。
一種極致的參數高效微調方法,只訓練模型中偏置項(Bias)的某些位,相比全模型微調減少99.9%的訓練參數,成本極低但性能接近全參數微調。
黑箱模型是指其內部運作機制對使用者而言不透明的模型,難以理解輸入與輸出之間的具體關係。
BLEU分數是一種評估機器翻譯文本品質的指標,通過比較候選譯文與參考譯文的n-gram重疊程度來計算,數值越高表示翻譯品質越好。
BM25 (Best Matching 25) 是一種用於資訊檢索的排序函數,它基於詞頻和逆文檔頻率,並考慮了文檔長度的影響,以提高檢索的準確性。
Boosting 是一種集成學習技術,透過迭代訓練一系列弱學習器,每個學習器都試圖糾正前一個學習器的錯誤,最終將它們組合起來形成一個強學習器。
DBSCAN 聚類中位於核心點鄰域內、但自身鄰域密度不足的邊緣資料點。
邊界框偵測是一種電腦視覺技術,用於在影像或影片中定位和識別物體,並使用矩形框標示出物體的位置。
以五數摘要(最小值、Q1、中位數、Q3、最大值)視覺化資料分布與離群值的統計圖表。
指從開始到完成AI模型或軟體專案建置過程所需的時間。
衡量AI模型或軟體專案建置過程中失敗次數佔總次數的比例。
位元組對編碼(BPE)是一種資料壓縮技術,也常用於自然語言處理中,作為一種詞彙標記化方法,將單詞分解成更小的子詞單元。
金絲雀部署是將新版本軟體或模型逐步發布給少數使用者,以便在全面推廣前偵測問題,有效降低風險並確保系統穩定性。
膠囊網路是一種神經網路架構,旨在解決卷積神經網路在處理物件方向和空間關係上的不足,透過膠囊和路由機制,更有效地捕捉物件的層次結構。
神經網路在學習新知識時快速遺忘舊知識的現象,導致之前習得的能力消失。
機器學習中取值為有限離散類別的特徵,如性別(男/女)、顏色(紅/綠/藍)、地區等,需要特殊編碼才能用於模型訓練
因果推論是從觀察數據中推斷因果關係的方法,旨在確定一個變數的變化是否直接導致另一個變數的變化。
因果語言模型是一種語言模型,它基於序列中先前詞彙預測下一個詞彙,並明確建模詞彙之間的因果關係,以提升生成文本的連貫性和可控性。
用數學或圖形方式表示變數間因果關係與機制的模型,包括結構方程模型與因果圖。
中央極限定理指出,大量獨立隨機變數的總和(或平均值)趨近於常態分佈,與原始變數的分佈無關。是統計推論的基石。
撤銷已發行但因故不再信任的數位憑證,防止其被濫用,確保AI系統安全與信任鏈完整性。
可證明穩健性指在特定的擾動範圍內,透過數學或嚴謹的演算法保證機器學習模型輸出不會發生改變的性質。
思維鏈是一種讓大型語言模型逐步推理,而非直接給出答案,以提升複雜問題解答正確率的方法
思維鏈提示是一種Prompt工程技術,透過引導模型逐步推理,提升複雜問題的解答品質與可解釋性。
比較不同時間點的影像,識別地表或物件狀態的變化,廣泛應用於監測。
聊天機器人是一種能模擬人類對話的電腦程式,透過文字或語音與使用者互動,提供資訊、協助解決問題或執行特定任務。
在模型訓練過程中定期儲存模型狀態與權重的技術,可防止意外中斷導致進度遺失,並便於後續推論或微調。
卡方檢定是一種統計方法,用於檢驗兩個或多個類別變數之間是否存在顯著關聯性。它比較觀察值與期望值之間的差異。
金吉拉縮放是一種模型縮放法則,旨在透過調整模型大小和訓練資料量,以達到最佳的計算效率,避免過度訓練或訓練不足。
分塊處理是指將大型資料集或文本分割成更小、更易於管理的部分,以便於模型處理和分析,提升效率。
引文網路是將文獻作為節點、引用關係作為有向邊的圖結構,用於分析學術影響力與知識傳承脈絡。
公民開發者是指,能運用低程式碼(LCNC)平台,開發應用程式的非資訊背景專業人士
訓練資料中各類別樣本數量差異懸殊,導致模型偏向多數類的問題。
類別權重是一種機器學習技術,透過賦予少數類別較高權重來解決資料不平衡問題,提升模型對稀有事件的預測能力。
在分類模型訓練時對不同類別樣本賦予不同損失權重的技術,用於緩解資料類別不平衡問題,使模型更重視少數類別。
一種條件生成技術,不依賴外部分類器,通過在無條件生成過程中注入條件信息來控制生成結果,常用於文本到圖像等多模態任務。
點擊率預測旨在預估使用者點擊特定廣告或連結的可能性,是數位廣告和推薦系統的核心技術。
AI 氣候模型是指使用機器學習加速和改進氣候模擬和預測的技術。AI 能從大規模氣象數據中學習複雜的氣候動態,提高預測準確性和計算效率,支持氣候變化研究和政策制定。
臨床自然語言處理 (Clinical NLP) 是一種利用自然語言處理技術,從醫療文本中提取、分析和理解資訊的AI應用,旨在改善醫療照護品質和效率。
CLIP (Contrastive Language-Image Pre-training) 是一種透過對比學習,將圖像與文字描述連結的模型,能進行零樣本圖像分類,無需針對特定任務重新訓練。
完形填空任務是一種語言理解測試,透過移除文本中的部分詞彙,要求模型或人類填補缺失部分,以評估其對上下文的理解能力。
統計語料中詞對同時出現的頻次形成的矩陣,是許多詞向量和 NLP 方法的基礎。
程式碼生成是指利用人工智慧模型,自動產生程式碼片段或完整程式的技術,旨在提高開發效率並降低編碼錯誤。
冷啟動問題是指在推薦系統中,對於新使用者或新物品,由於缺乏足夠的互動資料,導致無法準確推薦的問題。常見解決方案包括利用元資料、內容過濾或混合推薦。
協同過濾是一種推薦系統技術,透過分析使用者行為或偏好,預測使用者可能感興趣的項目,例如商品、電影或音樂。
利用強化學習演算法來解決複雜組合最佳化問題的技術,透過與環境互動學習最佳決策策略以尋求近似最佳解。
常識推理是賦予人工智慧運用人類日常生活基礎知識進行邏輯判斷的能力,使其能對未明言情境做出合理推斷。
計算生物學結合電腦科學、統計學與生物學,利用演算法分析生物數據,以理解複雜的生物系統與過程。
運算最佳訓練旨在於給定運算資源下,最大化模型效能。它涉及調整模型大小、資料集大小和訓練步驟,以達到最佳效率。
電腦視覺(Computer Vision)讓 AI 從圖像與影片中辨識物件、文字、人臉,廣泛用於自駕車、人臉辨識、醫療影像分析、工廠瑕疵檢測。
機器人視覺是指機器人使用攝像頭和深度傳感器配合計算機視覺算法,感知和理解視覺世界,完成抓取、組裝、檢測等任務。它使機器人能在動態環境中自主操作,廣泛應用於製造、物流和醫療。
概念瓶頸模型是一種深度學習模型,它強制模型通過人類可理解的概念來進行預測,從而提高模型的可解釋性和可控性。
概念漂移是指機器學習模型在部署後,由於資料分佈隨時間變化,導致模型預測準確度下降的現象。需要持續監控並重新訓練模型。
衡量數學問題或演算法對輸入微小變化的敏感程度。
評估分類模型效能的表格,顯示預測與真實類別的對應關係,幫助理解模型在各類別上的表現。
一種生成模型,通過學習將任意噪音水平的數據映射到同一最終樣本,實現單步或少步生成,不需要逐步去噪過程。
評估語言模型輸出一致性的研究方法,透過對同一問題的多次詢問分析模型回答的穩定性與可靠性。
將句子分解為層級詞組結構,建構樹形解析樹以顯示詞語與詞組的組成與支配關係。
一種對齐大型語言模型的方法,透過編制一份「憲法」(一組原則和價值準則),指導 AI 系統自我批評和改進行為,無需依賴大量人類反饋,實現更可控且價值對齐的 AI 系統。
憲法式AI原則是一種透過明確的價值觀或「憲法」來引導AI系統行為的方法,旨在確保AI的輸出符合人類的期望和倫理標準。
容器化技術是一種將應用程式及其所有依賴項打包到一個可移植容器中的技術,實現跨環境一致的部署。
數位證書與元資料標準,用於追蹤、驗證和建立對生成或修改媒體內容的來源與真實性的信任。
內容生成是指使用人工智慧技術自動創建文字、圖像、音訊或影片等內容的過程,旨在降低內容創作成本並提高效率。
內容過濾推薦是一種推薦系統方法,它基於用戶過去互動過的項目內容特徵,向用戶推薦相似的項目。它分析項目描述,並匹配用戶偏好。
根據物品的內容特徵與用戶的歷史偏好相似度,推薦相似物品。無需依賴其他用戶信息,適合新物品和冷啟動場景。
AI 模型在生成回應或進行預測時,所能參考與記憶的輸入資訊範圍及歷史對話內容。
將冗長的上下文內容壓縮為簡潔的摘要或關鍵信息,減少語言模型的輸入長度和計算成本。
上下文窗口是指,大型語言模型一次性能處理的最大 Token 數量,超過此限制模型便會遺忘先前的內容
有效利用 LLM 的上下文窗口(模型能處理的最大序列長度),在有限的空間內優先放置最重要的信息,避免超長內容丟失或品質下降。
持續學習旨在使AI模型能夠在不遺忘先前知識的情況下,逐步學習新的任務和資料,模擬人類終身學習的能力。
使模型在持續遇到新任務的過程中不斷學習和適應,同時避免遺忘舊任務的能力。
Word2Vec 中根據上下文詞預測目標詞的神經網路架構,是 CBOW 的完整名稱。
自動化將通過測試的程式碼變更直接部署到生產環境的軟體工程實踐。
CI 每次提交自動建置+測試,CD 通過後自動部署到生產環境。確保每個變更都安全
持續整合設計是規劃自動化流程,頻繁整合程式碼、建構與測試,旨在提升軟體開發效率與品質。
自動化系統持續收集新資料、重新訓練機器學習模型並部署新版本,使模型效能適應環境變化。
持續驗證是主動且持續地測試複雜系統的工程實踐,旨在確保模型與基礎設施在正式環境中始終符合預期的效能、穩定性與安全標準。
OpenAI 提出的多模態預訓練架構,透過對比學習同時訓練文字與影像編碼器,使兩者的語意空間對齊。
對比學習是一種自監督學習方法,通過學習區分相似和不相似的樣本,從而提取資料的有效表示,無需人工標註。
一種機器學習技術,透過拉近相似樣本的特徵並推開相異樣本,使模型能學習到更具區別性與對齊性的特徵空間。
ControlNet 是一種神經網路結構,用於控制大型擴散模型,例如 Stable Diffusion,以實現更精確的圖像生成控制,例如基於草圖或邊緣圖生成圖像。
對話式人工智慧是指能透過自然語言與人類進行互動的AI系統,例如聊天機器人或語音助理,旨在提供更自然、直觀的互動體驗。
在對話上下文中進行信息檢索,系統理解多輪對話的意圖和指代,提供上下文感知的搜尋結果。
凸優化是一種數學優化方法,旨在尋找凸函數在凸集合上的最小值。其優點是局部最小值即為全局最小值,易於求解。
卷積運算是提取特徵的數學操作,透過濾波器在資料上滑動捕捉邊緣與紋理,廣泛應用於電腦視覺領域。
神經網路中利用卷積運算自動提取局部特徵的層級,通過多個小尺寸濾波器滑動掃描輸入數據,能有效減少參數數量並增強空間特徵學習能力。
專門處理圖像的神經網路,用小窗口(卷積核)掃過圖片提取局部特徵,參數共享大幅減少計算量
Copilot 是一個 AI 程式碼助手,透過分析程式碼上下文,提供程式碼建議、自動完成和程式碼生成,提升開發效率。
在 DBSCAN 聚類演算法中,鄰域半徑 ε 內至少有 MinPts 個鄰居的資料點,是聚類簇的核心組成元素。
自動識別文本中指稱相同實體的不同表達式(如代詞、定指表達式),並將其分組聚集的任務。
共指解析是自然語言處理中的一項任務,旨在識別文本中指向同一個實體的不同提及(mentions),例如代詞、名詞短語等。
語料庫是大量結構化的文本集合,用於語言研究和自然語言處理,提供真實語言使用的範例,用於訓練和評估模型。
相關係數衡量兩個變數之間線性關係的強度和方向,範圍從 -1 到 1。1 表示完全正相關,-1 表示完全負相關,0 表示沒有線性關係。
量化多個變數兩兩之間線性相關程度的方陣,矩陣中每個元素為對應兩變數的皮爾森相關係數。
學習率沿著餘弦函數曲線逐漸衰減,從初始值平滑降低到最小值,使模型在訓練後期細微調整參數。
餘弦相似度是一種衡量兩個非零向量之間夾角餘弦值的度量方法,常用於評估文本或資料點之間的相似程度。
代價函數是所有訓練樣本損失函數的平均值,用於評估模型在整個訓練集上的表現,並作為優化算法的目標。
成本效益分析是評估 AI 專案投資回報的方法,計算直接節省成本加上間接效益後,扣除導入與維運成本,以判斷專案是否值得執行
反事實解釋描述了為了改變模型預測結果,輸入數據需要做的最小變動。它提供了一種理解模型決策邏輯的方式。
基於對現實世界的因果理解,推測「如果過去發生不同的事,現在會是什麼樣」的推理方式。
共變異數衡量兩個變數如何一起變化。正值表示它們趨於一起增加或減少,負值表示一個增加時另一個趨於減少,零值表示沒有線性關係。
描述多個隨機變數兩兩之間線性相關程度與各自變異數的對稱方陣。
共變數偏移是指機器學習模型在訓練與推論階段,輸入特徵的資料分佈發生改變,但給定特徵下的目標變數條件分佈保持不變的現象。
創用CC提供彈性版權許可,讓創作者分享作品,同時保留部分權利,促進知識共享與再利用。
信用評分是利用統計模型評估個人或企業的信用風險,預測其未來償還債務的能力,是金融機構決策的重要依據。
交叉熵損失是一種衡量兩個機率分佈之間差異的損失函數,常用於分類任務中評估模型預測結果與真實標籤的差距。
融合來自不同模態(文本、圖像、音頻等)資訊的注意力機制,用於多模態深度學習任務。
在不同數據模態(如文本、影像、音訊)之間建立聯繫與對齊,學習跨模態的統一表示或進行跨模態推理的機器學習方法。
交叉驗證是一種將資料分成多份,輪流以不同子集作為驗證集,藉此評估模型泛化能力的技術
晶體結構預測是指透過計算機演算法,從給定的化學組成預測材料在特定條件下的穩定三維晶體結構。
系統從簡單任務開始,逐步學習難度遞增的任務,提升效率和收斂性。
隨著資料維度增加,樣本空間呈指數級膨脹,導致資料密度急劇下降、距離量度失效,使機器學習模型的訓練難度與資料需求大幅提高。
資料是機器學習模型的學習基礎,包含結構化與非結構化形式,驅動 AI 系統發展。
資料標註是為資料集添加標籤或註解的過程,使機器學習模型能夠理解和學習這些資料,是模型訓練的基礎。
資料擴增術是一種增加訓練資料多樣性的技術,透過對現有資料進行微小的修改,創造出新的、但仍然代表相同類別的資料點,以提升模型泛化能力。
訓練資料中存在的系統性偏差,使模型對特定群體或情境產生不公平或不準確的預測結果,是 AI 公平性問題的主要根源之一。
描述資料集來源、組成、預期用途、限制與潛在偏誤的文件。
資料漂移是指模型上線後,輸入資料的分布與訓練資料不同,進而造成模型預測效能降低的現象
組織為確保資料品質、安全、合規和有效利用而建立的政策、流程、組織結構和技術框架。
資料不平衡指訓練資料中各類別樣本數量差異懸殊,導致模型傾向預測多數類別,常用 SMOTE 過採樣或欠採樣等技術來處理
資料填補是處理遺失值的方法,透過統計方法估算並替換遺失值,以維持資料完整性,避免分析偏差。
資料標註是指為原始資料添加標籤的過程,這些標籤提供關於資料的額外資訊,用於訓練監督式機器學習模型。
資料湖是一種大型集中式儲存庫,能以原始格式存放結構化、半結構化和非結構化的各式資料,提供高度彈性與可擴展性。
資料洩漏(Data Leakage)是指模型訓練過程中,未來或測試集的資訊意外滲入訓練集,導致模型在評估時表現虛高,但部署後實際效能大幅下滑的現象。
資料血緣追蹤記錄資料從來源到目的地的流動和轉換,提供資料的完整歷史和上下文,確保資料品質和可追溯性。
只收集、處理和保存完成特定目的所必要之最少個人資料的隱私設計原則。
資料並行是一種分散式訓練方法,將資料分割成多份,分配給多個節點,每個節點使用相同模型副本訓練不同資料子集。
資料管線是一系列資料處理步驟,將原始資料轉換為可供分析或模型使用的格式,包含擷取、轉換、載入等階段。
資料投毒攻擊是一種惡意攻擊,攻擊者將惡意或錯誤的資料注入到訓練資料集中,以影響機器學習模型的性能或行為。攻擊目標是使模型產生錯誤的預測或執行其他有害操作。
資料前處理是指在將原始資料用於機器學習模型之前,對其進行清理、轉換和整合的過程,以提高模型效能和準確性。
資料隱私是指保護個人資訊不被未授權存取、蒐集或濫用的原則與實踐,在 AI 系統中需遵循 PDPA 等法規要求
資料品質監控是指持續追蹤和評估資料的準確性、完整性、一致性、時效性和有效性,以確保資料符合預期標準。
將大規模資料集水平切割為多個獨立區塊,以提升平行處理效率與降低記憶體負荷。
資料驗證是確保機器學習模型訓練與推論資料之準確性、完整性與格式正確性的自動化檢查過程,能有效防止異常數據污染系統。
資料版本控制是一種管理機器學習專案中資料集與模型異動的技術,確保實驗的可重複性與團隊協作效率。
資料版本控制追蹤資料集在不同時間點的狀態,確保可重複性、可追溯性,並允許回復到先前的資料版本。
資料視覺化是將資料轉換為圖表、圖形等視覺形式的技術,幫助人們更直觀地理解資料模式、趨勢與異常,常用工具包括 Matplotlib、Tableau、Power BI
資料倉儲是針對查詢與分析優化的結構化資料儲存系統,整合多來源資料以支援商業智慧決策
密度型空間分群演算法(Density-Based Spatial Clustering of Applications with Noise, DBSCAN)是一種基於資料點鄰域密度進行分群的演算法,
二元分類器將預測機率轉換為類別標籤時使用的臨界值,通常預設為 0.5,但可調整以平衡精確率、召回率等不同業務目標。
決策樹是一種透過 if-else 條件判斷,將資料逐步拆解為更純粹子集的模型,具備高度可解釋性
解碼器是神經網路的一部分,負責將編碼器產生的抽象向量表示,轉換成人類可理解的目標輸出,如文字、圖片或語音。
深度學習模型架構設計,僅使用解碼器(Decoder)層進行文本生成和處理,無需編碼器,通過因果遮蔽使模型只能關注當前位置的歷史信息,實現自迴歸文本生成。
僅解碼器模型是一種專注於自迴歸生成的架構,透過預測下一個詞彙來產生連續文本,為現代語言模型的核心。
深度協同過濾結合深度學習與協同過濾,利用神經網路學習使用者和物品的隱藏表示,以提升推薦準確度,尤其在處理複雜互動模式時。
深度學習是一種機器學習方法,透過多層神經網路自動從原始資料中提取階層特徵,解決複雜問題。
利用深度神經網路學習用戶與物品的複雜非線性互動,自動提取高階特徵,實現精細化個性化推薦。
結合深度神經網路與Q學習的強化學習算法,能在高維狀態空間中進行最優決策。
深度Q網路(DQN)是一種結合深度學習與Q學習的強化學習演算法,利用深度神經網路逼近Q函數,解決高維度狀態空間的強化學習問題。
深度強化學習結合深度學習與強化學習,透過深度神經網路學習複雜策略,以在特定環境中最大化累積獎勵。
深度偽造是利用深度學習技術合成的逼真音訊、圖像或影片,通常用於製造假新聞、詐騙或惡意中傷。
深度偽造偵測旨在辨識經由深度學習技術偽造或操縱的影音內容,以防止不實資訊傳播和維護資訊真實性。
去噪擴散機率模型(DDPM)是一種生成模型,通過逐步添加高斯噪聲破壞資料,然後學習逆向過程,從噪聲中重建資料,實現高品質的資料生成。
使網路中的每一層都接收所有前面層的輸出作為輸入,通過特徵複用和梯度流通改善深層網路的訓練和性能。
密集圖像描述是一項結合電腦視覺與自然語言處理的技術,旨在偵測影像中的多個感興趣區域,並為每個區域生成對應的文字描述。
使用深度學習模型進行端到端訓練的文段檢索方法,將查詢和文段都編碼為密集向量,通過向量相似度進行匹配。
稠密檢索模型使用神經網路將查詢和文檔嵌入到一個低維向量空間中,通過計算向量相似度來檢索相關文檔,克服了傳統方法的詞彙不匹配問題。
DenseNet是一種深度學習模型,透過密集連接每一層到所有後續層,最大化層之間的資訊流動,增強特徵重用,減少梯度消失問題。
密度分群是一種基於資料分布密度的分群方法,它能找出任意形狀的群集,並自動識別出噪訊
依存句法分析是自然語言處理中,分析句子中詞彙之間的依存關係,建立句子的語法結構,揭示詞彙間的修飾、支配等關係。
從2D影像推斷場景的3D深度資訊,用於3D重建、機器人導航、AR應用和自動駕駛。
描述性統計使用數值摘要(平均數、中位數、標準差等)和圖表來描述資料集的集中趨勢、離散程度與分佈型態,是資料分析的第一步
指感測器或裝置隨時間產生資料分佈變化的現象,影響模型效能。
在多輪對話中自動追蹤和維護對話狀態(如用戶意圖、槽值),支持對話管理和任務完成。
對話系統是一種能與人類進行自然語言互動的AI系統,目標是理解使用者意圖並提供適當的回應,完成特定任務或提供資訊。
Dice Loss是一種用於衡量兩個樣本之間相似度的損失函數,尤其適用於處理不平衡的資料集,常見於圖像分割任務。
差分隱私是一種資料匿名化技術,透過在統計查詢結果中注入隨機噪音,在公開資料的同時保護個別資料點的隱私。
將擴散模型的去雜訊生成機制應用於文字序列生成的語言模型,透過迭代精化而非自回歸逐步生成文字。
擴散模型是一種生成模型,透過逐步將雜訊還原成清晰圖像,達成從隨機雜訊生成資料的目的
透過收集設備或用戶的多種可識別資訊,建立獨特且穩定的識別碼。
利用非對稱加密技術驗證電子文件真實性與完整性的密碼學機制。
數位分身是真實世界實體或系統的虛擬化身,通過收集數據進行模擬、監控和預測,以優化性能、預防故障和做出更明智的決策。
降維處理旨在減少資料集的特徵數量,同時保留重要資訊,以簡化模型、加速運算並避免維度災難。
直接侵權指未經授權而直接複製、散布或使用受版權保護作品的行為,在AI領域涉及模型訓練與輸出。
直接偏好優化(DPO)是一種直接利用人類偏好資料,優化語言模型,無需訓練獎勵模型的強化學習替代方案。
資料庫交易讀取到另一個尚未提交之交易所寫入的中間態資料,造成資料不一致的現象。
研究超越句子層級的文本結構、連貫性與邏輯關係的語言分析方法。
判別式 AI 學習輸入與輸出之間的條件機率 P(Y|X),直接預測分類或回歸結果,與生成式 AI 學習資料分佈 P(X) 相對
直接學習輸入特徵與輸出類別之間條件機率 P(Y|X) 的機器學習模型。
將空間注意力機制中不同維度或語義因素的表示分離,使模型能獨立控制空間定位與內容特徵的技術。
透過部署在廣大空間中的多個智慧感測器節點協同合作,收集並分析環境與系統狀態的分散式資料處理技術。
分散式訓練利用多個計算節點,將模型訓練任務分割並行處理,加速大型模型訓練,提升效率。
模型訓練時的資料分布與部署後實際遇到的資料分布不同,導致模型效能下降的現象。
DNA序列分析是計算生物學領域的關鍵技術,旨在解讀、比較和理解生物體的遺傳信息,對於疾病診斷、藥物開發和演化研究至關重要。
包含多個隱藏層的人工神經網路,能通過層層特徵抽取學習複雜的非線性表示,是現代深度學習的基礎架構。
將掃描或數位文檔轉換為結構化信息的技術,理解文檔內容、版面和邏輯關係。
將在來源領域(Source Domain)訓練的模型調整為能有效應用於目標領域(Target Domain)的遷移學習技術。
訓練資料與測試資料來自不同的統計分布或應用環境,導致模型性能下降的現象。
兩個向量逐元素相乘後加總的純量值,衡量向量間的相似程度與方向一致性。
Transformer 中最基礎的注意力機制,透過查詢向量與鍵向量的點積計算相似度,再用 softmax 轉為權重後對值向量加權求和。
隨機丟棄是一種訓練技巧,透過隨機關閉部分神經元,避免網路過度依賴單一路徑,提升模型的泛化能力
隨機失活遮罩在訓練時動態產生隨機二元矩陣,將部分神經元輸出暫時歸零,以打破特徵依賴並防止模型過度擬合。
藥物發現是指使用 AI 和機器學習從海量化學分子中識別和優化具有治療潛力的藥物候選物。AI 可以加速分子篩選、性質預測和優化過程,將藥物開發週期從十年縮短為數年。
AI藥物發現利用人工智慧加速藥物研發流程,從靶點識別、候選藥物篩選、臨床試驗設計到藥物重定位,降低成本並縮短開發週期。
藥物靶點預測是利用機器學習預測候選藥物分子與生物靶點蛋白質之間的結合力,加速新藥研發並降低實驗成本。
利用互逆任務(如中翻英與英翻中)之間的結構對稱性,建構閉環反饋系統以提升機器學習效能的無監督訓練框架。
根據系統負載和數據可用性,動態調整批次大小和處理時機的推理最佳化技術,用於平衡吞吐量和延遲。
提前終止是一種機器學習訓練技巧,藉由監控驗證損失,在模型過度擬合前及早停止訓練,以提高泛化能力。
邊緣人工智慧是指在靠近資料來源的邊緣設備上執行AI運算,而非在雲端伺服器上。可降低延遲、節省頻寬、保護隱私。
將計算與資料處理從中心化雲端移至靠近資料來源的終端裝置或區域節點,以降低延遲並減少頻寬需求。
邊緣運算AI是在終端裝置直接執行人工智慧模型的技術,具備低延遲、省頻寬與強化隱私保護等核心優勢。
識別影像中的邊界與輪廓線,通常輸出二值圖像或邊界概率圖,是許多高級視覺任務的前置步驟。
邊緣裝置指位於網路邊緣、靠近資料生成源頭的硬體設備,能在本地端直接執行資料處理與 AI 模型推論任務。
邊緣推理是在邊緣設備(如手機、物聯網設備、智能硬體)本地執行機器學習模型推理,而不是發送請求到遠端伺服器。它具有低延遲、隱私保護、離線可用等優勢。
高效神經架構搜尋(Efficient NAS)旨在降低NAS的計算成本,通過架構共享、代理模型等技術加速搜尋過程,找到高性能的神經網路架構。
針對計算、內存、功耗等資源約束進行優化的神經網路,在保持性能的同時減少參數量和計算複雜度。
EfficientNet 是一系列由 Google 開發的卷積神經網路架構,旨在透過複合縮放方法,在準確度和效率之間取得最佳平衡。
特徵值是線性變換作用於向量後,該向量長度縮放的比例。它描述了變換對特定方向向量的影響程度。
特徵向量是指在線性變換下,方向保持不變或僅反向的非零向量。它對應於特定的特徵值,代表變換的主要作用方向。
電子病歷人工智慧 (EHR AI) 指的是利用人工智慧技術分析電子病歷 (EHR) 數據,以改善醫療照護、研究和管理的應用。
嵌入表示將離散的文字或類別映射為連續稠密向量,讓模型能捕捉語義相似性並進行數學運算
嵌入矩陣是深度學習中將離散變數映射為連續稠密向量的權重矩陣,能有效捕捉詞彙或特徵間的語意與結構關聯性。
將文字、圖像、音頻等高維度輸入轉換為低維稠密向量表示的模型,使語義相近的內容在向量空間中距離相近。
具身人工智慧是指讓AI系統擁有物理軀體,透過與環境互動來學習和解決問題,強調感知、行動和環境之間的循環。
湧現能力是指大型語言模型在達到一定規模後,突然展現出在較小模型中未曾觀察到的複雜能力,例如推理、翻譯和程式碼生成。
編碼器將輸入資料轉換為固定長度的向量表示,提取其語義特徵,以供解碼器或下游任務使用。
端到端自動駕駛是一種深度學習架構,直接將感測器資料轉換為駕駛控制指令,無需人工設計中間模組。
集成學習透過結合多個弱學習器,建立一個強學習器,以提高模型的準確性和泛化能力,常見方法包括Bagging、Boosting和Stacking。
實體鏈接是將文本中的實體提及項,連結到知識庫中對應實體的過程,以消除歧義並豐富文本的語義資訊。
實體解析是一種資料處理技術,旨在識別並連結來自不同資料來源中指涉相同真實世界實體的記錄,以建立統一且一致的實體視圖。
熵是資訊理論中衡量隨機變數不確定性的指標,數值越高代表不確定性越大。在機器學習中,熵常用於特徵選擇和決策樹構建。
Epoch(訓練輪次)是模型完整遍歷一次訓練資料集的過程;訓練輪次數量影響模型效果,過多會造成過擬合,過少會導致欠擬合。
將連續型數值特徵依等距區間分割成有限個離散類別的資料前處理技術。
AI 公平性指標,要求模型對不同群體(如不同性別或族群)的真陽性率與假陽性率均相等。
資料工程核心流程,將原始資料從來源系統擷取(Extract)、清洗轉換(Transform)後,載入(Load)至目標資料倉儲或 AI 訓練管線的三段式架構。
歐盟於 2024 年 5 月正式生效的全球首部綜合 AI 監管法規,對 AI 系統的開發、部署和使用設定強制性要求。
在貝氏推論中,證據指觀測資料的邊際機率。因計算困難,實務上常透過最大化證據下界來最佳化生成模型。
期望最大化 (EM) 算法是一種迭代算法,用於在存在隱變量的情況下,估計機率模型的參數。它交替執行期望 (E) 步驟和最大化 (M) 步驟。
機器學習模型決策過程的透明度與可理解性,使用戶與利益相關者能理解模型為何做出特定預測。
可解釋 AI 透過視覺化或簡化模型,讓複雜的黑箱模型預測決策過程能被人類理解、信任與稽核。
降維後每個主成分解釋原始資料總變異量的比例,用於評估降維結果保留了多少資訊。
梯度爆炸是指在深度學習模型訓練中,梯度在反向傳播時變得異常巨大,導致權重更新過大,模型訓練不穩定甚至崩潰。
探索與利用是強化學習中的權衡,探索是指嘗試新動作以發現潛在的更好策略,利用是指使用已知最佳策略以獲得最大獎勵。
在機器學習建模前,透過視覺化與統計方法理解資料特徵、發現模式並檢驗假設的關鍵資料處理步驟。
當使用者對領域不熟悉、目標模糊時,透過反覆查詢與學習來釐清資訊需求並獲取新知的資訊檢索過程。
描述隨機事件發生的等待時間或相鄰事件間隔的連續機率分佈,具備無記憶性。
指數平滑法是一系列時序預測方法,使用加權平均數,其中權重隨著時間的推移呈指數衰減,更重視近期觀測值。
萃取、轉換、載入(ETL)是資料工程的核心流程,指從多個來源提取數據,經過清洗與格式轉換,最終載入至目標資料倉儲的過程
提取式摘要技術從原文中選擇重要句子組成摘要,簡單直接,易於實現,但可能缺乏連貫性,且無法進行語義概括。
GBDT 的進化版,加入正則化防過擬合,支援缺失值和並行化,是比賽和業界的常勝軍
Precision 和 Recall 的調和平均數 = 2PR/(P+R),兼顧「找得準」和「找得全」
人臉辨識是一種電腦視覺技術,用於自動識別或驗證圖像或影片中的人臉,並與已知人臉資料庫進行比對。
用低秩因子向量建模特徵間的二階交互作用,兼具線性模型的效率和特徵交互學習的能力。
AI 公平性要求模型對不同族群的決策結果無系統性歧視,需透過資料平衡與演算法設計確保一致待遇,是負責任 AI 的核心原則。
公平性約束是在機器學習模型訓練或部署過程中引入的數學條件,旨在防止系統對特定群體產生偏見,確保演算法決策的公正性。
人工智慧公平性旨在確保AI系統的決策不會對特定群體或個人產生不合理的歧視,追求結果的公正與平等。
機器學習公平性旨在確保人工智慧系統決策的客觀與公正,防止演算法因使用者的種族、性別或年齡等受保護特徵而產生系統性的偏見與歧視。
模型預測為陰性(負例),但實際上為陽性(正例)的錯誤分類結果。
模型將實際為負的樣本錯誤預測為正的情況,又稱型一錯誤。
Faster R-CNN是一種物件偵測演算法,它使用區域建議網路(RPN)來生成候選區域,並使用卷積神經網路(CNN)對這些區域進行分類和邊界框回歸。
系統在部分元件發生故障時仍能持續正常運作的能力。
量化每個輸入特徵對模型預測結果的貢獻程度,幫助理解和驗證模型的決策依據。
機器學習中,輸入資料的特徵分佈隨時間變化的現象,可能導致模型性能下降。
特徵工程透過創建、轉換與選擇原始資料的代表性特徵,顯著提升機器學習模型的預測效果
特徵擷取是從原始資料中自動識別並提取有意義的特徵表示的過程,目的是降低資料維度同時保留關鍵資訊,提升模型學習效率
一種在不改變程式碼的情況下,動態啟用或停用系統功能與機器學習模型的工程技術。
量化輸入特徵對機器學習模型預測結果影響程度的指標,用於特徵選擇與模型理解。
特徵圖是卷積神經網絡中,經過卷積層運算後所產生的多維陣列,用於呈現輸入資料的特定局部特徵與空間結構。
特徵金字塔網路(FPN)是一種用於目標檢測的深度學習架構,旨在從不同尺度的特徵圖中提取豐富的語義信息,以提升小目標的檢測性能。
特徵縮放是一種資料前處理技術,用於將不同範圍的特徵值縮放到一個統一的範圍內,避免某些特徵主導模型訓練。
特徵選擇是機器學習中選擇最相關特徵子集的過程,旨在簡化模型、提高準確性、減少過擬合和提升模型的可解釋性。
特徵儲存庫是一個集中管理和共享機器學習特徵的平台,確保特徵一致性、可重用性,並簡化特徵工程流程。
允許在不重新部署程式碼的情況下,動態開啟或關閉特定功能,便於A/B測試與風險管理。
將原始特徵通過數學變換或編碼映射為新的特徵表示,以改善機器學習模型的學習效果和泛化能力。
聯邦平均算法透過對多個節點的本地模型參數進行加權平均,在不收集原始資料的情況下訓練全局模型。
聯邦邊緣學習是一種將機器學習模型訓練下放到邊緣設備的分散式架構,藉由保護數據隱私的同時提升運算效率。
聯邦學習是一種多方協作的機器學習方法,各方在本地訓練模型,僅共享模型更新,保護原始資料
回饋迴路是指系統輸出影響其輸入的過程,在AI中用於迭代改進模型效能,透過評估結果並調整參數。
前饋神經網路是一種訊息單向傳播的神經網路,由輸入層、隱藏層和輸出層組成,廣泛應用於分類和迴歸任務。
用極少量目標域標籤資料,在保持源域知識的前提下快速適應新域。
少樣本學習讓模型僅憑少數標記範例即可泛化至新任務,突破傳統機器學習對大量訓練資料的依賴
在提示詞中提供少量(通常 2-10 個)輸入輸出範例,引導語言模型依照示範格式完成任務的提示技術。
允許在不解密的情況下直接對密文執行任意計算,計算結果解密後等同於對明文運算的密碼學技術。
金融 AI 是指應用於金融市場預測、風險管理、詐欺偵測和投資決策的人工智能技術。它使用機器學習分析大量財務數據和市場信號,提升交易策略的性能和降低風險。
微調是在預訓練模型基礎上,以少量特定領域資料繼續訓練,使通用模型適應特定任務需求,提升性能。
閃電注意力機制是一種優化注意力計算的技術,透過重新排序計算步驟和利用硬體加速,大幅提升注意力計算的速度和記憶體效率。
通過重新組織注意力計算的記憶體訪問模式和利用 GPU 快速片上記憶體,大幅加速 Transformer 注意力層的技術。
一種生成模型訓練方法,通過學習光滑的向量場使數據從噪音流向目標分佈,相比擴散模型具有更快的推理速度。
焦點損失函數 (Focal Loss) 是一種用於解決物件偵測中類別不平衡問題的損失函數,它通過降低易分類樣本的權重,使模型更關注難分類樣本。
衡量時間序列預測結果的可靠性與波動範圍,反映未來事件的不可預測程度。
長短期記憶網路(LSTM)的核心門機制,通過 sigmoid 激活函數產生 0-1 的控制信號,決定上一時步細胞狀態中有多少信息應被遺棄或保留,是解決梯度消失問題的關鍵元件。
基礎模型是使用大量未標記數據訓練的大型模型,可適應多種下游任務,展現出強大的泛化能力和遷移學習能力。
AI 詐欺偵測(Fraud Detection)透過機器學習即時分析交易行為,識別異常模式,廣泛應用於銀行信用卡詐欺防範、網路詐騙偵測與保險理賠審核。
頻率計數是計算特定事件、特徵或字詞在數據集中出現次數的統計方法,為資料分析與機器學習提供基礎特徵。
將類別特徵轉換為其在資料集中出現的頻率或計數,以捕捉資訊並降低維度。
神經網路中每個神經元都與前一層所有神經元相連的層級,每條連接都有獨立的可學習權重,能進行高度非線性的特徵轉換,常用於網路最後階段進行分類或迴歸。
函數呼叫是一種允許大型語言模型(LLM)調用外部函數或API的能力,以擴展其功能並與外部世界互動。
驗證AI模型或系統在特定輸入下行為是否符合預期功能的過程。
將博弈論的均衡概念應用於多智能體AI系統,分析競合關係下的策略最優性。
閘控循環單元(GRU)是一種循環神經網路(RNN)的變體,旨在解決傳統RNN的梯度消失問題,更有效地捕捉長期依賴關係。
高斯雜訊是一種機率密度符合常態分佈的隨機干擾訊號,數值多集中於平均值,常應用於資料擴增與生成模型中。
一種用數百萬個可學習的 3D 高斯橢球體表示場景幾何與外觀的技術,可從多角度照片重建出能即時渲染的高品質 3D 場景。
歐盟於 2018 年施行的個人資料保護法規,規範個人資料的收集、處理與跨境傳輸,對 AI 系統的設計與部署有直接影響。
基因表達預測利用機器學習分析DNA序列與生物特徵,以推估細胞中特定基因的轉錄活躍度與產物生成量。
歐盟通用資料保護規範是保障歐盟公民個人資料控制權的法規,對違規企業處以高額罰款,影響全球企業。
泛化能力是指機器學習模型在未見過的數據上表現良好的能力。一個具有良好泛化能力的模型能夠從訓練數據中學習到普遍規律,並應用於新數據。
生成分佈是指生成式人工智慧模型在給定隨機噪聲或潛在變數後,所產生的合成資料在特徵空間中呈現的機率分佈。
生成對抗網路是一種透過生成器與鑑別器互相對抗學習,最終使生成器能產出逼真資料的深度學習模型
生成式 AI 是能夠產生新內容(文字、圖像、音訊、程式碼等)的人工智慧系統,基於學習大量訓練資料的分佈特徵來生成符合語境的輸出
生成式模型(Generative Model)是能夠學習資料的機率分布並從中生成新樣本的機器學習模型,涵蓋 GAN、VAE、擴散模型等架構,廣泛應用於影像合成、文字生成與資料擴增。
OpenAI 的自回歸語言模型,一個字接一個字生成文本,只使用 Decoder 架構
基因演算法是一種模擬生物進化過程的優化算法,通過選擇、交叉和突變等操作,逐步演化出更優的解,用於解決複雜的搜索和優化問題。
指資料在多維空間的拓樸與形狀特徵,幾何深度學習利用此對稱結構處理圖論、流形與點雲等非歐幾里得資料。
地理空間AI結合人工智慧與地理空間資料,分析地球表面現象,從衛星影像、地圖和感測器數據中提取洞察,支援智慧城市、環境監測等應用。
衡量資料集標籤混雜程度的指標,常用於決策樹的分裂準則,值越低表示越純淨。
透過全局詞共現統計學習詞向量,將詞對共現頻次分解為兩個向量的內積。
GPT是一種基於Transformer架構的大型語言模型,透過預訓練學習大量文本資料,用於生成文本、翻譯語言、回答問題等。
圖形處理器(GPU)是一種專為並行處理設計的電子電路,最初用於加速圖像渲染,現廣泛應用於深度學習等需要大量計算的領域。
通過高效利用 GPU 硬體特性(記憶體層次、並行單元、向量化)提升深度學習訓練和推論性能。
利用離散神經記憶碼本對知識編輯目標局部化的大型語言模型知識修正框架。
Grad-CAM是一種可視化技術,利用梯度資訊來突出顯示輸入圖像中對模型預測最重要的區域,提供模型決策的可解釋性。
多個訓練步驟內累加梯度,最後進行一次參數更新,有效增加批量大小而不增加記憶體占用,用於訓練記憶體受限的大型模型。
梯度提升法是一種機器學習技術,透過迭代地組合弱學習器(通常是決策樹)來建立強大的預測模型,每次迭代都專注於修正前一個模型的錯誤。
梯度裁剪是一種防止梯度爆炸問題的技術,通過限制梯度的大小,確保訓練過程的穩定性,避免模型參數更新過大。
梯度下降是一種透過反覆運算,沿損失函數的梯度方向,逐步逼近損失函數最小值的演算法
梯度懲罰是用於穩定生成對抗網路的正則化技術,透過限制梯度範數以確保模型平滑,能防止模式崩潰。
在分散式機器學習中,匯總多個運算節點的梯度以確保模型參數一致更新的過程。
圖異常偵測是分析圖結構與節點特徵,以識別出網路中異常節點、邊或子圖的技術,常應用於金融防詐與資安防護。
使用注意力機制對圖的鄰域進行聚合的 GNN 模型,能為不同鄰居節點分配不同的權重。
圖分類是將整個圖形結構映射到特定類別的機器學習任務,旨在根據節點、邊及整體拓撲特徵預測圖形的屬性或狀態。
一種 GNN 的具體實現,透過鄰域節點特徵的加權平均來更新每個節點的表示。
將圖中的節點或邊映射到低維向量空間的技術,保留原圖的結構信息和語義關係。
圖結構生成是一種利用機器學習模型自動建立或擴充圖結構資料的技術,旨在模擬真實世界中節點與邊的複雜關聯網路。
一種 GNN 模型,基於圖同構測試的 Weisfeiler-Lehman 算法設計,具有較強的圖判別能力。
圖神經網路(GNN)是一種用於處理圖結構資料的深度學習模型,能學習節點、邊和圖的表示,並用於節點分類、連結預測和圖分類等任務。
圖池化是一種減少圖形結構資料維度與節點數量的技術,用以提取全域特徵,降低計算成本,在圖神經網路中扮演關鍵的降維角色。
圖檢索增強(Graph RAG)利用知識圖譜結構化信息,提升檢索效率和答案準確性,優於傳統向量檢索。
抓取規劃是機器人學中的核心技術,旨在為機器人手臂規劃出有效且穩定的抓取動作,以成功拾取、移動或操作物體,確保任務執行效率與安全性。
貪婪解碼是一種序列生成方法,在每個時間步選擇概率最高的詞作為輸出,直到生成終止符號或達到最大長度。它簡單快速,但可能陷入局部最佳解。
網格搜尋是一種超參數調校方法,它窮舉超參數空間中所有可能的組合,並評估每個組合的模型效能。
頓悟學習指模型在訓練初期泛化能力差,但經過長時間訓練後,突然展現出良好的泛化能力,如同頓悟一般。
真實邊界框是電腦視覺模型訓練與評估中,由人工標註的正確物件位置範圍,作為衡量預測結果的基準標準。
在圖像中定位自然語言描述的物體,通過將文本表達與圖像中的視覺區域進行對應,實現視覺語言理解。
一種高效的注意力機制,將多個查詢頭共享同一組鍵值頭,減少模型參數和記憶體消耗,同時保持性能不下降。
LSTM的簡化版本,參數更少、訓練更快,在多數序列任務上性能相當。
AI安全護欄是用於限制AI系統行為,確保其符合預期規範和倫理標準的機制,防止產生有害或不當的輸出。
AI 幻覺是大型語言模型產生自信但事實錯誤或無中生有內容的現象,是 LLM 部署的主要風險
識別和分類手部的形狀、位置和動作,用於人機互動、手語識別等應用。
霍克斯過程是一種自激發點過程,事件發生會增加未來事件發生的機率。常用於建模事件序列的相互影響,如金融交易、地震或社交媒體互動。
由多種不同類型、來源或格式的資料組成,具有高度多樣性和複雜性的資料集合。
包含多種節點類型和邊類型的圖,其中不同類型的節點或邊具有不同的特徵和語義。
隱藏狀態是神經網路中用於儲存與傳遞歷史資訊的內部記憶向量,負責在處理序列資料時保留上下文特徵,協助模型理解時序依賴關係。
階層式分群(Hierarchical Clustering)是一類無監督學習演算法,透過逐步合併最相似的群組(凝聚法)或分裂群組(分裂法)來建立樹狀結構的群組層次,不需預先指定群數。
階層式密度分群演算法(Hierarchical DBSCAN, HDBSCAN)是 DBSCAN 的進化版本,透過建立多密度尺度的階層式叢集樹,能自動適應密度不均勻的資料,無需設定全局鄰域半徑 ε,並
將複雜任務分解為多層子任務,由不同層級的策略分別優化的強化學習方法。
階層式強化學習將複雜任務分解為多層次的子任務,透過高低層策略協同運作,解決稀疏獎勵與長期規劃問題。
指特徵空間中的極高維度狀態,或深度學習模型萃取出具備高度抽象、全局觀念與豐富語意的高階向量表示。
系統在面對故障、維護和負載波動時,能持續提供服務、維持高正常運行時間的設計屬性。
高基數特徵(High Cardinality)指某個類別型特徵包含大量不同取值的情況,例如用戶 ID、商品 SKU、地理位置等可能有數萬至數百萬種取值,直接進行 One-Hot 編碼會導致維度爆炸,需
同態加密是一種先進加密技術,允許直接對加密數據執行計算,而無需事先解密,確保數據隱私。
根據資源使用率自動增減 Kubernetes 叢集中 Pod 數量的機制,確保應用效能並最佳化資源配置。
透過增加更多節點或機器來擴展系統處理能力,以應對AI工作負載增長。
Hugging Face 提供開源機器學習模型與資料集託管,協助開發者協作、分享並快速部署各類人工智慧應用。
指在人工智慧系統的訓練、評估與決策過程中,系統性引入人類專業知識與反饋的機制,以確保模型行為符合預期。
人機迴路 (HITL) 是一種 AI 方法,其中人類參與模型訓練和決策過程,以提高準確性、可靠性和倫理考量。
研究人類與機器人之間互動的跨學科領域,旨在設計更自然、高效且安全的協作方式,提升使用者體驗與系統效能。
混合搜尋結合了多種搜尋技術,例如關鍵字搜尋和語義搜尋,以提高搜尋結果的相關性和準確性,提供更全面的資訊。
超參數是機器學習模型訓練前,由人為設定且影響模型學習效果的參數,例如學習率或網路層數
超參數調校是機器學習中,尋找最佳超參數組合以提升模型效能的過程,涉及多次模型訓練與評估。
分析包含數百個窄頻譜波段的影像,以識別材料成分與特性。
假設檢定是一種統計方法,透過樣本數據評估關於母體的假設是否成立,藉由計算機率值判斷證據強度,進而做出決策。
假設性文件嵌入是一種檢索技術,透過語言模型先生成假設解答,再將該解答轉為向量以搜尋真實文件。
AI 模型對數位圖片進行處理、分析或生成的基礎技術,涵蓋像素級的特徵萃取、語意解析與跨模態影像合成。
影像描述生成(Image Captioning)是電腦視覺與自然語言處理的交叉任務,旨在讓模型自動為輸入影像產生自然語言描述,是多模態 AI 的核心應用之一,評估指標常用 BLEU、CIDEr、SPI
圖像分類是電腦視覺中的一項任務,旨在將圖像分配到預定義的類別中。模型學習圖像特徵,並基於這些特徵預測圖像所屬的類別。
圖像生成是一種人工智慧技術,旨在從文字描述、其他圖像或隨機雜訊中創造出全新的、逼真的或風格化的圖像。
利用周邊像素信息自動填充或重建影像中的遺失、損壞或標記區域,用於去除物體、修復老照片等。
圖像識別是電腦視覺領域的一項任務,旨在識別圖像中的對象、人物、地點或事件。它比圖像分類更廣泛,可能涉及定位和標記圖像中的多個對象。
影像分割是一種電腦視覺技術,將影像劃分為多個區域或物件,以便分析或理解影像內容,常用於醫學影像分析、自動駕駛等。
從低解析度影像重建高解析度版本,增加像素數或恢復細節,廣泛應用於監視、醫療影像、老照片增強。
在多模態學習中,將圖像和文本的表示映射到共同的語義空間,使得語義相關的圖文對的表示相近。
圖像轉文字生成是一種將視覺資訊轉換為自然語言描述的技術,使電腦能夠理解並用文字表達圖片內容。
透過學習專家演示直接訓練智能體策略的監督學習方法。
機器人模仿學習是一種讓機器人透過觀察人類或其他專家示範來學習技能的方法,旨在使機器人能執行複雜任務。
使用者在與推薦系統互動時被動產生的行為信號(如點擊、購買、停留時間),相對於明確評分等顯式回饋,隱式回饋資料量更大但含義更模糊。
上下文學習 (In-context Learning) 指的是大型語言模型無需額外訓練,僅通過輸入範例即可學習新任務的能力。
上下文學習理論指大型語言模型無需額外訓練,僅憑藉輸入提示中的範例,即可執行新任務的能力,展現了模型泛化的潛力。
使用多分支並行卷積的架構,在同一層中採用不同大小(1×1, 3×3, 5×5)的卷積核進行特徵提取,捕捉多尺度信息。
Inception Network 是一種深度卷積神經網路架構,旨在透過並行使用多種卷積核大小,捕捉不同尺度的特徵,提升模型效能。
推論是指利用已訓練好的機器學習模型,對新的、未曾見過的資料進行預測或判斷的過程。是模型部署後的核心環節。
推論最佳化旨在提升已訓練模型的推論速度、降低資源消耗,使其更有效率地部署於實際應用中。
透過對比正負樣本,最大化互資訊下界的損失函數,主要用於自監督表徵學習。
從非結構化文本中自動識別和提取特定信息的技術,將非結構化數據轉為結構化知識。
信息檢索是一個計算機科學領域,旨在從大規模的資料集合中精準查找符合用戶需求的相關信息。它是搜索引擎、推薦系統和知識管理的核心技術。
資訊理論研究資訊的量化、儲存與傳輸,核心概念包含熵、互資訊、通道容量等,為資料壓縮、通訊編碼等領域奠定基礎。
內積是計算兩向量相似度與投影關係的數學運算。在機器學習中用於衡量特徵相關性,為神經網路的核心基礎。
長短期記憶網路(LSTM)的關鍵元件,通過 sigmoid 激活函數產生 0-1 之間的門控信號,動態控制有多少當前輸入信息應被添加到細胞狀態,實現選擇性的信息流控制。
在影像中同時偵測物件並為每個獨立個體生成精確像素級遮罩,區分同類中的不同個體。
指令微調是一種利用特定格式指令資料集,微調預訓練語言模型,使其更精確理解並執行人類指令的技術。
探索不足是指代理人過早專注於已知的高回報行為,未充分嘗試其他未知行為,導致陷入局部最佳解的現象。
整合地獄是指在系統開發與機器學習專案中,將各自獨立開發的模組或模型進行合併時,因依賴衝突而引發的嚴重錯誤與發布延遲。
意圖分類是自然語言處理中的一項任務,旨在將一段文字(例如使用者查詢)分類到預定義的意圖類別中,以理解使用者的目的。
自動分析自然語言輸入,識別用戶的主要意圖或目標,用於驅動對話系統或任務執行。
標註者一致性衡量多位標註者在相同資料上標註結果的相似程度。高一致性代表標註品質良好,反之則可能需要重新評估標註規範。
結合異常偵測與可解釋AI技術,不僅識別異常點,還能說明異常發生的原因,提升決策透明度。
設計和使用易於人類理解決策過程的機器學習模型,透過明確的特徵-預測映射提高透明性與信任度。
交並比是物件偵測中,用來評估預測框與真實框定位準確度的指標,計算兩者重疊面積與聯集面積的比率
在特定子任務上直接評估模型或表示的質量,如詞向量的類比任務,不涉及下游應用。
入侵偵測系統(IDS)是一種安全系統,旨在監控網路或系統中的惡意活動或策略違規行為。它通過分析流量、日誌和系統行為來識別潛在的入侵。
逆向設計是一種從目標性能出發,利用機器學習或最佳化演算法推導出滿足該性能之材料結構或系統參數的方法。
逆向文件頻率(IDF)是一種評估詞彙重要性的統計指標,用於降低常見詞彙權重並突顯罕見關鍵字。
逆向運動學是計算機器人或骨骼動畫等系統中,為了達到特定末端效應器位置和姿態,各關節需要旋轉的角度。
從專家演示的行為推斷潛在獎勵函數的強化學習方法。
物聯網是將實體裝置透過網際網路相互連接,使其能收集並傳輸資料的技術架構,為智慧化應用提供資料基礎。
衡量兩個邊界框或區域重疊程度的指標,值域 0 到 1,常用於物件偵測與影像分割的評估。
四分位距(Interquartile Range, IQR)是第三四分位數(Q3)與第一四分位數(Q1)的差值,代表資料中間 50% 的分布範圍,常用於穩健的異常值偵測,不受極端值影響。
孤立森林是一種無監督異常偵測演算法,透過隨機切割資料空間,將數量稀少且特徵獨特的資料點快速分離出來。
迭代反向翻譯是一種自然語言處理技術,透過將目標語言翻譯回來源語言生成合成平行語料,並反覆交替訓練正反向模型以提升翻譯品質。
通過輸入設計或提示工程來繞過 AI 模型的安全限制,使其執行原本被禁止的行為
一種對大型語言模型或其他 AI 系統的攻擊方法,通過巧妙地設計輸入提示詞或利用模型的漏洞,繞過系統的安全防護和內容政策限制,使模型生成原本應該被阻止的內容,如有害建議、違法信息或有成見的輸出。
詹森-夏農散度(Jensen-Shannon Divergence, JSD)是一種衡量兩個機率分布相似程度的對稱指標,以 KL 散度為基礎改良,輸出範圍為 [0, 1](使用以 2 為底的對數時),
K 均值分群是一種將資料點分配到 K 個群集的演算法,透過反覆運算,將點分配到最近的群集中心,並更新中心位置,直到收斂
K 近鄰演算法是一種基於實例的學習方法,透過找出距離最近的 K 個鄰居,以投票方式決定資料點的分類
在支援向量機等演算法中,將低維資料映射到高維特徵空間的函數,使原本線性不可分的問題變得可分。
定期更換加密金鑰的資安實踐,以降低金鑰洩露風險並限制潛在損害。
KL散度(Kullback-Leibler Divergence)衡量兩個機率分佈的差異,數值越大代表分佈差異越大,常用於評估模型預測分佈與真實分佈的接近程度。
K 近鄰演算法(K-Nearest Neighbors, KNN)是一種非參數式監督學習演算法,透過尋找訓練集中距離最近的 K 個樣本進行多數投票(分類)或加權平均(回歸),無需建立顯式的模型參數。
知識庫是儲存結構化和非結構化知識的中央儲存庫,用於支援決策、自動化任務和提供資訊。
知識蒸餾是一種模型壓縮技術,透過讓小模型模仿大模型的輸出,使其在保有精準度的同時,大幅縮減模型體積
知識融合是將來自多個異構來源的知識整合為統一、連貫表示的過程,旨在提升AI系統的理解與推理能力。
知識圖譜(Knowledge Graph)是以圖結構儲存實體(Entity)及其關係(Relation)的語意知識庫,透過「主體—關係—客體」三元組表示現實世界的知識,廣泛應用於搜尋引擎增強、問答系統
預測知識圖譜中缺失的事實(三元組),填補現有知識圖譜的不完整部分。
一種技術,將知識圖譜中的實體和關係嵌入到連續向量空間,以便進行關係預測和推理。
基於結構化知識庫回答使用者問題的系統,能精準檢索並進行多跳邏輯推理。
用於比較樣本分佈與理論分佈是否相同,或兩個樣本是否來自相同分佈的無母數統計檢定。
比較兩個機率分佈是否相同的非參數統計檢定方法,常用於評估資料漂移與模型輸入分佈變化。
衡量兩個機率分佈之間差異程度的指標,常用於資訊理論、生成模型訓練與分佈比較。
在大型語言模型推理中,預先計算並存儲前面 token 的鍵和值向量,避免重複計算的優化技術。
L1 正則化透過懲罰權重的絕對值總和,驅使模型將不重要特徵的權重歸零,達到特徵選擇的效果
L2 正則化是一種機器學習技術,透過在損失函數中加入權重平方和的懲罰項,促使模型權重縮小,有效降低模型複雜度並避免過度擬合,提升泛化能力。
標籤偏誤是指訓練資料的標註結果反映了人類主觀判斷或社會既有成見,導致資料標籤帶有系統性偏差,使AI模型學習到不公平的關聯。
標籤分布漂移(Label Drift)指模型在生產環境中遭遇的目標變數(標籤)分布與訓練時不同的現象,例如詐欺偵測中詐欺案件占比從 1% 升至 5%,導致原本校準好的模型閾值和效能指標失效,需觸發再訓
標籤編碼是將類別型資料轉換為整數,以便機器學習模型處理,但需注意可能產生不必要的順序關係
標籤雜訊是指訓練資料集中不正確或錯誤的標籤。這些錯誤標籤會降低模型效能,導致模型學習到錯誤的模式。
拉格朗日乘數是一種尋找約束條件下函數極值的方法。它引入拉格朗日函數,將約束條件納入目標函數,從而將約束優化問題轉化為無約束優化問題。
土地覆蓋分類是將遙感影像像素歸類為不同地物類型的過程。
LangChain是一個用於開發基於大型語言模型(LLM)應用程式的框架。它簡化了LLM的整合、鏈接和部署,讓開發者能快速構建複雜的AI應用。
在AI中,「語言」專指機器對人類自然語言的理解與生成能力,是實現人機順暢溝通與通用人工智慧的關鍵技術橋樑。
語言模型是一種機器學習模型,用於預測給定文本序列中下一個詞彙或字符的概率分佈,是自然語言處理的基礎。
透過統計或神經網路方法,學習文字序列的機率分布,用於預測下一個詞或評估句子合理性的模型。
拉普拉斯平滑(Laplace Smoothing)又稱加一平滑,是貝氏統計中避免零機率問題的技術,在計算類別條件機率時,將每個類別的計數加上常數 α(通常為 1),防止訓練集未見過的詞彙或特徵使整個機
大型語言模型是以大量文字訓練的超大 Transformer 模型,擅長理解並生成自然語言
一種在線性迴歸損失函數中加入 L1 懲罰項的迴歸方法,可自動將不重要特徵係數壓縮至零,實現特徵選取。
潛在擴散模型(LDM)是一種生成式AI模型,透過在潛在空間中進行擴散和逆擴散過程,生成高解析度、高品質的圖像或其他資料。
潛在空間是機器學習模型學習到的高維資料的壓縮表示,它捕捉了資料的底層結構和關係,並將其映射到一個低維空間。
層歸一化是一種神經網路正規化技術,它在每個層級對所有神經元的激活值進行歸一化,以加速訓練並提高泛化能力。
學習是AI系統從數據中自動提取模式、規律與特徵,藉以提升特定任務效能的核心過程。
學習率是機器學習模型訓練中的關鍵超參數,它決定了梯度下降演算法每次更新模型參數的步長與幅度,過大可能導致模型震盪,過小則會使收斂速度緩慢。
根據訓練進度動態調整學習率的策略,能幫助模型在初期快速收斂,並在後期穩定尋找全域理想解。
學習率排程是一種在訓練過程中調整學習率的技術,旨在加速收斂、避免震盪,並提高模型的泛化能力。常見方法包括步階衰減、指數衰減和餘弦退火。
訓練初期逐漸增加學習率,避免初始化不佳導致的訓練不穩定,通常在前幾個 epoch 內從 0 線性增加到目標值。
系統透過經驗不斷改進自身的學習過程,達到越來越高效的適應和泛化能力。
將排序問題轉化為機器學習任務,透過訓練排序模型預測查詢-文檔對的相關性,自動優化排序順序。
留一法交叉驗證是一種極端形式的交叉驗證,每次訓練模型時排除一個資料點,並用該點進行測試,重複此過程直到每個資料點都被用作測試集一次,以評估模型性能。
詞形還原是自然語言處理中將單詞還原為其基本形式(詞元)的過程,考慮了單詞的語法和上下文。
光達資料處理是指對雷射雷達感測器採集的三維點雲資料進行清理、分析與解釋的過程,旨在從中提取有意義的空間資訊,廣泛應用於自動駕駛、測繪與環境監測等領域。
機器學習系統在整個生命週期內不斷學習新知識、新任務,同時保留和擴展既有知識。
微軟開發的高效梯度提升實現,採用葉子生長策略和直方圖優化,訓練速度和記憶體效率通常。
局部可解釋模型無關解釋(Local Interpretable Model-Agnostic Explanations, LIME)是一種模型可解釋性技術,透過在單一預測結果附近擾動輸入資料並訓練簡單
以連續折線呈現資料隨時間或有序類別變化趨勢的統計圖表,是資料視覺化的基礎工具。
線性迴歸法是一種統計方法,用於建立自變數和應變數之間的線性關係模型。目標是找到最佳擬合線,以預測應變數的值。
假設因變數與一個或多個自變數之間存在線性關係,並透過最小化殘差平方和來估計參數的統計預測模型。
一種圖學習任務,目標是預測圖中兩個節點之間是否存在或將存在邊的連結。
LLaMA(Large Language Model Meta AI)是 Meta 開發的開放權重(open-weight)大型語言模型系列,可免費下載、修改、自行部署,採 Meta 自訂 community license 授權,非 OSI 認證開源。
LlamaIndex是一個資料框架,用於連接大型語言模型(LLMs)與您的私有或特定領域的資料,簡化建立基於LLM的應用程式。
以大型語言模型為核心決策引擎,結合工具調用與記憶機制,自主規劃並執行多步驟任務的 AI 系統。
讓大型語言模型的行為與人類價值觀、意圖及社會規範一致的技術與方法體系。
LLMs 是大型語言模型群的統稱,代表當今具備強大自然語言理解與生成能力的各類基礎模型集合。
將進入的網路請求或運算工作分配到多台伺服器的基礎設施元件,避免單點過載並提升系統可用性。
將運算請求分散至多台伺服器或 AI 推論節點的技術,以提升系統吞吐量、降低延遲並避免單點過載。
AI負載平衡將AI任務分散到多個計算資源,確保資源有效利用,避免單點過載,提升整體系統效能和穩定性。
LIME 針對單筆預測,以局部線性模型近似複雜黑箱模型的行為,提供與模型無關的可解釋性
局部異常因子是一種透過比較資料點與其鄰近樣本的局部密度差異,藉此找出潛在異常值的無監督機器學習演算法。
一種結合位置上下文與語言模型的個人化 AI 框架,使模型能根據使用者的地理位置、行動軌跡與空間情境提供更精準的推薦或回應。
對數損失(Log Loss)是交叉熵損失在二元分類問題中的特殊形式,衡量模型預測機率與真實標籤之間的差異,數值越小代表模型表現越好。
將數值特徵取對數以壓縮偏態分布、縮小量級差距,使數據更接近常態分布的前處理技術。
邏輯程式設計是一種基於形式邏輯的程式典範,透過宣告事實與規則來推導結論,而非明確指令執行步驟。
邏輯式人工智慧利用形式邏輯表示知識並進行推論,旨在模擬人類的符號推理過程,解決複雜問題,強調可解釋性。
邏輯形式生成是將自然語言轉換為結構化、機器可讀且無歧義表達式的過程,為語意分析的核心。
邏輯迴歸是一種廣義線性模型,用於預測二元或多元分類結果的機率。它使用 Sigmoid 函數將線性組合轉換為機率值,並透過最大似然估計來訓練模型。
指時序資料裡跨度極大的長程關聯性,或資料集中呈現數量極少但種類繁多的極端不平衡長尾樣本分佈現象。
指大型語言模型能夠處理和理解更長输入序列的能力,通常指支援數千到數百萬個 token 的上下文窗口。
長短期記憶網路是一種改良的循環神經網路,透過門控機制來克服傳統 RNN 在長序列中容易遺忘的缺陷
長距離依賴指資料序列中相距遙遠元素的關聯。捕捉此關聯是模型理解長篇上下文的核心。
在數據分布遵循長尾分布的任務中進行學習,其中少數類別擁有大量樣本,多數類別樣本稀缺。
留一交叉驗證(Leave-One-Out Cross-Validation, LOOCV)是 K 折交叉驗證的特例,每次將一個樣本作為驗證集,其餘所有樣本作為訓練集,重複執行 N 次(N 為樣本數),
AI 代理在環境中不斷感知、預測、行動並以回饋更新內部世界表徵的閉環學習架構。
LoRA是一種參數高效的微調技術,透過學習低秩矩陣來適應預訓練模型,大幅減少訓練參數,降低計算成本。
損失函數衡量模型預測與實際值之間的差異,數值越小代表模型預測越準確,是模型訓練中優化目標的關鍵組成部分。
低程式碼平台讓使用者透過視覺化拖拉介面快速開發應用,大幅降低軟體開發的技術門檻與時間成本
利用深度學習技術改善在弱光或夜間條件下拍攝的影像品質,提升亮度、降低雜訊並恢復細節。
透過在預訓練模型的權重矩陣旁插入低秩分解矩陣來進行參數高效微調的技術。
一種具有門控機制的循環神經網路變體,透過遺忘門、輸入門和輸出門有效解決傳統 RNN 的梯度消失問題,能捕捉長距離序列依存關係。
機器學習讓電腦透過分析大量資料自動找出規律,無需明確程式指令即可完成預測與分類任務
把 DevOps 的實踐應用到 ML 系統上,自動化模型的訓練、部署、監控全生命週期
讓電腦系統具備閱讀人類語言文本並回答相關問題能力的自然語言處理技術。
機器翻譯是利用電腦程式自動將文字或語音從一種語言轉換成另一種語言的技術,旨在打破語言障礙,促進跨文化交流。
版本控制系統中主要的開發線路,通常包含穩定且可發布的程式碼。
惡意軟體偵測是利用AI技術識別並阻止惡意軟體感染系統的過程,旨在保護電腦、網路和資料免受損害。
Mamba是一種基於選擇機制的序列模型,旨在解決Transformer在長序列建模上的效率瓶頸,透過硬體感知演算法提升運算速度。
透過內外層梯度最佳化找到最佳初始化參數,使任何模型在新任務上經少量更新後快速收斂。
從衛星、航空或無人機影像中提取地理資訊,自動或半自動生成地圖。
一種統計假設,主張系統在給定當前狀態下,未來的演變與過去歷史狀態相互獨立,即未來只取決於現在。
馬可夫決策過程(MDP)是一種用於建模決策的數學框架,其中結果部分隨機,部分受決策者控制。它廣泛應用於強化學習。
Mask R-CNN是一種深度學習模型,用於物件偵測、實例分割和人體姿勢估計。它擴展了Faster R-CNN,增加了預測每個物件像素級別遮罩的分支。
計算機視覺領域的自監督學習方法,隨機遮蔽輸入影像的部分區域,訓練模型從可見像素重建被遮蔽區域,類似於視覺版的遮蔽語言模型。
遮蔽語言模型(MLM)是一種自監督學習方法,隨機遮蔽輸入文本的部分詞語,並訓練模型預測這些被遮蔽的詞語。
一種自監督預訓練任務,隨機遮蔽輸入序列中的部分 token,讓模型依據上下文預測被遮蔽的原始詞,是 BERT 系列模型的核心訓練目標。
結合注意力機制的度量學習方法,透過為支持樣本分配動態權重來預測查詢樣本的類別。
材料科學AI運用機器學習加速新材料的發現與設計,能精準預測材料特性並最佳化製程,顯著縮短研發週期。
矩陣分解是一種將矩陣分解為兩個或多個矩陣乘積的技術,常應用於推薦系統,以預測用戶對未評分項目的偏好。
矩陣分解推薦是一種推薦系統技術,它將用戶-項目互動矩陣分解為兩個低維矩陣,分別代表用戶和項目的隱含特徵,用於預測用戶對未互動項目的偏好。
既是光滑流形又具有群結構的矩陣集合,在機器人學、3D 視覺、幾何深度學習中用於描述剛體運動與對稱性。
最大似然估計 (MLE) 是一種統計方法,用於估計機率分佈的參數,它通過最大化觀察到樣本數據的似然函數來實現。
一種衡量兩個機率分佈之間差異的統計距離,常用於生成模型評估與領域適應。
平均絕對誤差(MAE)是衡量預測值與實際值之間平均絕對差異的指標,數值越小代表模型預測越準確。
平均精確率(MAP)是評估信息檢索系統排序質量的重要指標。它在不同的召回率點上計算精確率,然後求平均值,全面反映系統的排序性能。
均方誤差是一種常用的迴歸模型評估指標,它計算預測值與真實值之間差異的平方平均值,能有效衡量模型預測的準確性,並對較大的誤差給予更高的懲罰。
衡量系統或組件從故障到完全修復所需的平均時間,是可靠性工程關鍵指標。
機制性可解釋性旨在理解AI模型內部運作的具體機制,如同理解程式碼般,而非僅僅觀察輸入輸出關係。
醫療 AI 是指應用於醫療診斷、治療和管理的人工智能技術。它使用機器學習和深度學習對醫學影像進行分析、輔助診斷、預測患者風險和個性化治療方案。
醫療影像分析利用AI技術,自動或半自動地分析醫學影像,輔助醫生進行疾病診斷、病情監測和治療規劃,提高診斷效率和準確性。
梅爾頻譜圖是一種音訊訊號的視覺表示,它將音訊的頻率轉換到梅爾尺度上,更符合人類聽覺感知,常用於語音辨識和音訊分析。
成員推論是一種隱私攻擊技術,旨在判斷特定資料樣本是否曾被用於訓練特定的機器學習模型。
成員推斷攻擊旨在判斷特定資料點是否曾被用於訓練機器學習模型。攻擊者利用模型輸出來推斷訓練資料的成員關係,可能洩漏隱私資訊。
記憶率衡量AI模型對訓練資料中特定樣本的過度記憶程度,可能導致隱私洩露或泛化能力差。
在神經網路基礎上增加外部記憶模組,透過可學習的讀寫機制實現長期資訊儲存和檢索。
具有外部記憶機制的神經網路架構,能夠存儲、檢索和更新信息,支持推理任務。
一種統一的圖神經網路框架,將圖學習過程表述為節點間的消息生成、傳遞和聚合。
元學習,又稱學習如何學習,旨在訓練模型能夠快速適應新任務或環境,透過少量樣本即可達到良好的效能。
將資料線性轉換到指定區間(通常為 [0, 1])的特徵縮放方法,透過減去最小值再除以值域來實現。
指多模態模型在部分輸入資料(如影像或音訊)缺失或損壞時,仍能維持穩定預測效能與系統運作的能力。
語言模型處理序列時用於表示遮蔽或缺失位置的特殊符號,常見於遮罩語言模型訓練與填空推論任務。
混合精度訓練是一種使用不同精度(如 FP16 和 FP32)的浮點數進行模型訓練的技術,旨在加速訓練過程並減少記憶體佔用。
混合正則化是一種透過組合兩個或多個訓練樣本及其標籤來生成新訓練數據的技術,藉此擴增資料集多樣性,有效減輕神經網路模型的過擬合現象並提升泛化能力。
深度混合是一種模型架構,它結合了多個不同深度的子網路,以提升模型的表達能力和泛化能力,並允許模型根據輸入動態調整其深度。
專家混合模型是一種機器學習技術,透過結合多個獨立的「專家」模型,針對不同輸入選擇性地激活特定專家,以提升模型整體效能。
機器學習管線是自動化機器學習工作流程的步驟序列,包括資料準備、模型訓練、評估和部署。
MLOps 是一種將機器學習模型開發與部署流程標準化的方法,旨在加速模型迭代、提高可靠性並簡化維護。
專為資源受限的行動設備(手機、平板、邊緣設備)設計的輕量級神經網路,確保低延遲、低功耗的推理。
MobileNet是一種針對移動和嵌入式設備設計的輕量級深度神經網路架構,旨在實現高效的資源利用和快速的推論速度。
這是一個測試用的短定義,長度超過二十個字元以符合 lint 規則的要求,這樣才能成功推進。
GAN 訓練時生成器只輸出少數幾種重複樣本而喪失多樣性的訓練失敗現象。
透過機器學習演算法在大量數據中學習規律與特徵後,所產生可用於預測、分類或生成的數學結構與參數集合。
一種元學習方法,訓練模型使其對新任務能透過少量樣本迅速適應,與模型架構無關。
模型即服務(MaaS)是一種雲端運算服務,提供預先訓練好的機器學習模型,讓使用者透過API存取並應用於各種任務,無需自行訓練模型。
模型快取是一種將已訓練的模型儲存在記憶體或快速儲存裝置中,以加速模型載入和推論的技術。
概述AI模型性能、限制、預期用途、評估指標與潛在風險的文件。
模型壓縮是指減少機器學習模型大小和計算複雜度的技術,以便在資源有限的設備上部署,同時保持模型性能。
邊緣端模型壓縮是縮減神經網路體積與運算量的技術,使人工智慧模型能在資源受限的邊緣裝置上順暢執行。
模型部署是指將訓練完成的機器學習模型整合到實際應用環境中,使其能夠接收輸入數據並產生預測結果,為業務決策提供支援。
模型評估是衡量機器學習模型在未知資料上表現的過程,透過特定指標來確保模型的泛化能力與實用性。
模型反演攻擊是一種試圖從機器學習模型中恢復訓練數據或敏感資訊的攻擊方式,藉此洩漏隱私。
模型監控是持續追蹤機器學習模型在生產環境中的效能和行為,以確保其準確性、可靠性和公平性。及時發現並解決問題。
模型平行化是一種將大型模型分割到多個裝置上進行訓練或推論的技術,以克服單一裝置的記憶體限制。
模型參數是機器學習模型從資料中學習到的內部數值變數,包含權重與偏差,主要決定模型如何產生預測結果。
模型登錄庫是集中管理 AI 模型版本、追蹤訓練紀錄與部署狀態的系統,如同模型的戶籍系統
從多個候選機器學習模型中,依評估指標與驗證策略選出泛化能力最佳的決策過程。
模型服務化是指將訓練好的機器學習模型部署到生產環境,使其能夠接收請求並返回預測結果的過程。
模型竊取是一種針對機器學習模型的網路安全攻擊手法。攻擊者透過大量且有系統地向目標模型的應用程式介面發送查詢,並記錄其回傳的預測結果,藉此訓練出一個功能與原始目標高度相似的替代模型。
模型版本控制是追蹤和管理機器學習模型不同迭代的過程,確保可重複性、可追溯性和協作。
學習環境模型(動態和獎賞),用模型進行規劃而非直接與環境互動的強化學習方法。
分子動力學預測結合人工智慧與物理模型,以計算模擬原子與分子系統的運動軌跡,大幅加速新藥開發與材料發現。
運用生成式人工智慧模型,探索廣大化學空間並精準設計出具有特定期望性質之全新分子結構的前沿技術。
分子圖將化學分子抽象為圖形,以節點代表原子、邊緣代表化學鍵,是機器學習處理分子結構的核心格式。
蒙地卡羅方法是一種利用隨機抽樣來估算數學問題解的計算技術。它通過大量模擬隨機事件,統計結果,從而得到近似解。
從視頻序列中估計場景或相機的運動,包括物體運動、相機運動(ego-motion)及場景流等。
運動規劃是計算機科學和機器人學中的一個領域,旨在為機器人或其他代理找到從起點到終點的可行路徑,同時避開障礙物並滿足特定約束。
自駕車運動規劃是為自動駕駛車輛計算安全、可行且最佳行駛路徑的技術,確保車輛能避開障礙物並達成駕駛目標。
安全多方計算(Multi-Party Computation,MPC)是一種密碼學協議,允許多方在不揭露各自私有輸入資料的前提下,共同計算某個函數的結果,廣泛應用於聯邦學習、隱私保護 AI 推論等場景
磁振造影(Magnetic Resonance Imaging)在 AI 語境中指深度學習模型用於 MRI 影像的分析、加速重建或疾病偵測的技術應用。
Multi 泛指人工智慧中結合多種資料類型、任務或智能體的技術,能大幅提升系統處理複雜現實問題的靈活性。
多個智能體在同一環境中互動的強化學習,須處理協作、競爭和通訊等複雜關係。
多代理系統是由多個獨立自主的代理(Agent)組成的計算機系統,這些代理透過相互溝通、協調與合作,共同解決複雜問題或達成特定目標。
Transformer 的核心元件,透過多組平行的注意力運算同時捕捉輸入序列在不同子空間中的依賴關係。
多跳推理是指需要通過多個推理步驟才能得出結論的推理過程,模擬人類複雜的思考方式。
一種在連續影像中偵測並識別多個移動物件,持續賦予穩定追蹤編號與軌跡預測的電腦視覺分析技術。
多步預測是一種時間序列分析技術,旨在同時或依序預測未來多個時間點的數值,而非僅單一未來點。
多任務學習是一種機器學習方法,旨在同時訓練一個模型來執行多個相關任務,以提升模型的泛化能力和效率。
同時學習多個相關任務的強化學習方法,利用任務間的知識共享提升效率。
利用同一對象的多個不同視角或特徵表示進行機器學習,並從多視角中提取一致性信息以提升模型性能。
多模態 AI 能同時處理並整合多種類型的輸入資料(文字、圖像、聲音、影片等),產生跨模態的理解與輸出
多模態學習是一種機器學習方法,旨在從多種不同類型(模態)的資料中學習,例如圖像、文字和音訊,以提升模型效能。
音樂生成是利用AI模型自動創作音樂,涵蓋旋律、和聲、節奏等多個方面,旨在模擬人類作曲過程。
從音樂內容提取結構化資訊(如流派、演唱者、節拍、旋律)或進行檢索與推薦的技術與研究領域。
互信息衡量兩個隨機變數之間相互包含的信息量,數值越大代表相關性越高,常用於特徵選擇、圖像配準等任務。
N元語法是一種自然語言處理技術,用於預測序列中下一個詞的概率,基於前N-1個詞的出現頻率。
樸素貝氏分類器是一種基於貝氏定理的簡單機率分類器。它假設所有特徵之間相互獨立,簡化了計算複雜度,因此得名「樸素」。常用於文本分類等任務。
命名實體辨識是自然語言處理的核心技術之一,它能自動從非結構化文本中識別出具有特定類別意義的實體,例如人名、地名、組織機構、日期等,並進行分類標註。
NAS 是一種自動化設計神經網路架構的技術,旨在減少人工設計的試錯成本,讓演算法自行尋找效能最佳的模型結構。
自然語言生成(NLG)是將結構化資料轉換為人類可理解的自然語言文本的AI技術,廣泛應用於報告生成、聊天機器人等。
自然語言推論是判斷前提句子是否能邏輯推導出假設句子的技術,協助機器理解語言的深層語意關係。
自然語言處理使電腦能理解、分析和生成人類語言,是 AI 語音助理與翻譯等應用的核心技術
醫療 NLP 是指應用自然語言處理技術於醫療文本的技術,如電子病歷、臨床筆記、病理報告等。它能自動提取關鍵醫療信息、識別臨床事件、輔助診斷和生成臨床決策支持。
自然語言理解(NLU)是人工智慧的一個分支,旨在使電腦能夠理解和解釋人類語言的含義,從而執行相關任務。
描述在一連串獨立伯努利試驗中,達到指定成功次數之前所需失敗次數的機率分布。
一種最佳化技術,用於在訓練模型時高效選擇負例,尤其在推薦系統和NLP中。
從非結構化文字中自動識別並分類人名、地名、組織名等具體命名實體的 NLP 技術。
利用神經網絡隱式表達3D場景的函數,能從多視角影像重建逼真的3D場景和新視角合成。
巢狀欄位是一種資料結構,指一個欄位內部包含其他子欄位,形成階層關係,常用於表示複雜或半結構化資料,提升資料組織與查詢效率。
神經架構搜尋(NAS)是一種自動化設計神經網路架構的技術,旨在尋找在特定任務上表現最佳的模型結構,無需人工手動設計。
使用深度神經網路進行端到端機器翻譯的技術,相比傳統統計方法質量顯著提升。
神經網路是模仿人類大腦神經元結構的機器學習模型,由多層節點(神經元)組成,透過加權求和與激活函數學習複雜的非線性關係
神經輻射場景(NeRF)是一種使用神經網路表示3D場景的新穎方法,它通過學習場景的體積密度和顏色來實現逼真的渲染。
神經符號人工智慧結合了神經網路的學習能力和符號AI的推理能力,旨在克服各自的局限性,實現更強大、更可靠的AI系統。
神經形態運算是一種模擬生物大腦結構的硬體架構,旨在以極低的功耗執行複雜的機器學習與人工智慧運算任務。
BERT 預訓練的輔助任務,給定兩個句子,判斷第二個句子是否在原文本中直接跟隨第一個句子,用於訓練模型理解句子間的邏輯關係。
無程式碼是一種開發平台,讓使用者無需編寫任何程式碼,也能建立應用程式或自動化流程
一種圖學習任務,目標是為圖中的節點預測標籤或類別,利用圖結構和節點特徵進行學習。
節點嵌入是一種將圖形結構中的節點轉換為低維度連續向量的技術,目的是保留節點在原圖中的網絡拓樸與特徵資訊,以便於後續進行各類機器學習任務。
在 DBSCAN 聚類演算法中,不屬於任何聚類的樣本點,即鄰域內核心點密度不足、也非邊界點的孤立資料點,通常代表離群值或異常值。
非極大值抑制 (NMS) 是一種在物件偵測中用於消除重複框的技術,它會保留置信度最高的框,並抑制與之高度重疊的其他框。
常態分佈是一種連續機率分佈,其機率密度函數呈鐘形曲線,平均數、中位數和眾數相等,數據集中在平均值附近。
正規化是一種資料前處理技術,將資料縮放到一個單位範數,例如L1或L2範數,使每個樣本的向量長度為1。
NDCG 是評估排序系統性能的重要指標。它基於相關性等級進行計算,強調靠前結果的重要性,廣泛應用於搜索引擎和推薦系統的評估。
新穎性偵測是一種機器學習技術,旨在識別訓練資料中從未出現過的全新模式或資料點,通常用於確保系統在面對未知情況時的穩定性。
根據累積機率選擇詞彙範圍,只從機率累計達到設定閾值(如 90%)的最少詞彙中採樣,比 Top-k 更能適應不同機率分布。
物件偵測是一種電腦視覺技術,用於識別影像或影片中特定物件的位置和類別,常用於自動駕駛、安全監控、零售分析等。
利用AI技術在衛星影像中識別並定位特定物件,如建築、車輛、船隻等。
機器人透過感測與控制,對實體物件進行抓取、移動、放置等動作,以完成特定任務的技術。
目標函數是機器學習模型訓練中用於評估模型表現的函數,其數值代表模型預測與實際值的差距,優化目標是最小化或最大化此函數。
光學字元辨識(OCR)是一種技術,能將圖像中的文字轉換為機器可讀的文字格式,例如將掃描文件轉換為可編輯的文字。
從預先收集的固定資料集學習策略,不與環境互動,適合昂貴或危險環境。
透過最小化殘差平方和來估計線性回歸模型係數的統計方法。
研究 AI 系統是否及如何產生欺騙性輸出的學術方向,涵蓋幻覺、策略性錯誤陳述與對齊失敗等問題。
裝置端學習是一種直接在智慧型手機等終端設備上進行模型訓練與推論的技術,能降低延遲並提升資料隱私安全性。
單類別支持向量機為非監督式異常偵測演算法,利用正常樣本建立高維邊界,以分離出落於邊界之外的異常資料。
獨熱編碼是一種將類別資料轉換為二元向量的方法,為每個類別建立獨立欄位,存在時標記為 1,其餘為 0
單樣本學習是一種機器學習方法,旨在僅使用一個或少數幾個樣本來學習新的類別或概念,模擬人類快速學習的能力。
線上學習是一種機器學習方法,模型在接收到每個新資料點後立即更新,無需儲存所有資料或進行批次訓練,適用於資料流場景。
ONNX 是一種開放標準,用於表示機器學習模型,允許模型在不同框架之間互操作,簡化模型部署流程。
本體論是明確指定領域概念及其關係的正式表示,用於知識共享和推理,是知識圖譜的基礎。
從非結構化文本或現有數據自動發現和學習本體及概念關係。
分佈外指測試資料的特徵分佈與訓練集不一致的現象,對 AI 模型的泛化能力構成重大挑戰。
分類任務中測試集包含訓練集未見過的類別,模型需識別『這是一個未知類別』的問題。
OpenAI開發的多模態模型,透過對比學習理解圖像與文字關係,實現零樣本識別。
估計影片相鄰幀之間像素的運動向量,用於動作檢測、影片壓縮、視覺導航等應用。
指機器學習訓練過程中,最佳化演算法為更新模型權重所儲存的動量、變異數等歷史計算數值。
選項框架是層次化強化學習中的數學模型,透過將基礎動作抽象為高階宏觀動作,幫助智能體在複雜環境中進行長時間跨度的規劃與決策。
流程協調是指自動化安排、協調和管理複雜的計算機系統、應用程式和服務的過程,以實現特定目標。
將類別型特徵依照其固有順序轉換為整數的編碼方式,保留類別間的大小關係。
一種具有明確順序或等級關係,但數值間距不一定均等的類別型資料。
識別測試樣本是否來自訓練分布的異常檢測技術,用於檢測模型未見過的樣本。
識別模型在推論時遇到的輸入是否來自訓練資料分布之外的技術,以防止模型在未知情境下給出不可靠的預測。
長短期記憶網路(LSTM)的門控機制之一,通過 sigmoid 激活函數產生 0-1 的信號,決定細胞狀態中有多少信息應被輸出至隱藏狀態,控制網路對外部環境的信息交互程度。
神經網路最後一層,根據任務類型選擇合適的激活函數,將隱藏層的高維特徵轉換為最終預測結果(分類概率、迴歸值或其他形式),是模型與外界交互的界面。
過擬合指模型過度記憶訓練資料的細節與雜訊,導致在未見過的新資料上預測表現大幅下滑
優化物品對的相對順序,確保相關物品排在不相關物品之前。計算複雜度與效果的良好平衡點。
PaLM (Pathways Language Model) 是 Google 開發的大型語言模型,以其卓越的推理能力和多語言處理能力著稱。
一種整合實例分割與語義分割的神經網路架構,透過特徵金字塔網路同時處理前景物件與背景環境的高效模型。
深度學習模型中用於同時執行語義與實例分割的模組。
全景品質是評估全景分割同時辨識物件與分割區域是否正確的綜合指標。
結合語義分割和實例分割,同時處理可數物體(分個體)和不可數物體(只分類),提供完整的場景理解。
全色銳化是將高解析度全色影像與低解析度多光譜影像融合,生成高空間解析度且色彩豐富的多光譜影像。
一種分散式機器學習架構,專門負責儲存與更新全域模型參數,並與多個工作節點進行通訊與資料同步。
只調整少量參數即可讓大型預訓練模型適應特定任務的技術,代表方法包括 LoRA、Adapter 和 Prefix Tuning。
模型參數是機器學習模型在訓練過程中學習到的數值,用於決定模型如何對輸入資料進行轉換和預測。它們是模型的內部變數。
詞性標注是自然語言處理中,為句子中的每個詞彙指定詞性的過程,例如名詞、動詞、形容詞等,是後續語法分析的基礎。
視覺化機器學習模型中某個特徵與預測結果的邊際關係,展現改變該特徵值如何影響預測。
段落排序是一種信息檢索技術,不是返回整個文檔,而是返回包含相關信息的最相關段落。它提高了搜索結果的精確性和用戶體驗。
病理學AI利用人工智慧分析組織切片影像,輔助病理醫生診斷癌症、感染等疾病,提升診斷效率和客觀性。
包含多個自變數及其偏導數的方程式,廣泛用於描述物理現象,近年成為科學機器學習的核心研究對象。
感知器是最簡單的神經網路模型,模擬生物神經元,接收輸入、加權求和、通過激活函數輸出,用於二元分類。
困惑度衡量語言模型預測文本序列的能力,數值越低代表模型預測能力越好,對文本的理解程度越高。
持久化儲存卷是在容器化環境中獨立於容器生命週期的儲存資源,能確保系統或任務重啟時資料不會遺失。
階段性發布是一種將新版人工智慧模型或軟體功能逐步推送給使用者的部署策略。透過分階段增加流量比例,團隊能在全面上線前,於真實環境中監控效能並控制潛在風險。
允許在加密資料上執行有限種類(加法或乘法之一)的計算,且結果解密後與在明文上執行相同運算相同的密碼技術。
網路釣魚偵測是利用AI技術識別並阻止網路釣魚攻擊的過程,旨在保護用戶免受詐騙、身份盜竊和財務損失。
結合物理定律與神經網路的機器學習模型,用於求解偏微分方程,無需大量標籤數據。
將深度神經網路的不同層分配到不同的 GPU 設備上,讓多個 micro-batch 在不同層上交叉執行以提高 GPU 利用率的分佈式訓練方法。
在人工智慧中,規劃是指為達成特定目標,自動生成一系列行動步驟的過程。它涉及預測行動的結果,並選擇最佳的行動序列。
三維空間中由大量無序點組成的資料結構,每點含坐標和屬性,用於3D感知、掃描、建模和分析。
卜瓦松分佈是一種離散機率分佈,描述在固定時間或地點內,事件發生的次數。其特點是事件發生是獨立且隨機的。
策略崩潰是強化學習中因參數更新過度,導致行為迅速退化成單一無效模式的現象,嚴重破壞訓練穩定性。
策略梯度是一種直接優化策略的強化學習方法,它通過計算策略梯度來更新策略參數,以最大化預期累積獎勵。
強化學習中代理人用於表示自身行動策略的機制,區分當前被最佳化的策略與環境互動所用的策略。
衡量模型輸入資料分佈在不同時間點之間偏移程度的指標,用於監控模型是否因資料漂移而需要重新訓練。
投資組合最佳化利用數學模型,在給定的風險承受度下,尋求最大化投資回報或在給定的回報目標下,最小化投資風險。
確定人體或物體在三維空間中的位置和方向,通常輸出關鍵點(如關節位置)的坐標。
位置編碼是一種將序列中單詞或符號的位置資訊嵌入到向量表示中的技術,使模型能感知序列順序。
事後插補是在模型訓練完成後,於推論階段或生成事後解釋時,即時填補缺失特徵的技術。
在模型訓練完成後應用的量化技術,通過將浮點參數轉換為低精度整數或定點數來減少模型大小和計算成本,實現過程簡單但精度損失相對較大。
研究語言在具體交流上下文中的使用方式與使用者意圖的語言學分支。
精確率是模型預測為正例中真正為正例的比例,反映預測結果的準確度,與召回率形成取捨
分類模型評估的核心指標:精確率衡量預測為正的樣本有多準確,召回率衡量實際為正的樣本被找回多少。
二分類評估工具,縱軸為精確率,橫軸為召回率,展示模型在不同決策閾值下精確率和召回率的權衡關係,特別適合評估類別不均衡問題
預測分析(Predictive Analytics)運用機器學習與統計模型,從歷史資料預測未來趨勢或事件機率,廣泛用於銷售預測、風險管理、客戶流失預防。
利用機器學習分析設備感測器數據,預測設備故障發生時間,在故障前安排維護以降低停機損失。
前綴調整法是一種參數高效的微調技術,通過在輸入序列前添加可訓練的前綴向量,來引導預訓練模型生成期望的輸出,同時保持原始模型參數凍結。
主成分分析是一種降維技術,藉由找出資料變異最大的方向,將高維度資料投影至低維度空間,以保留關鍵資訊
在訓練和使用機器學習模型時,採用技術和方法來保護個人數據的隱私和敏感信息的機密性
機率式預測是一種時間序列預測方法,它不僅提供單一的點預測,還提供未來值的完整機率分佈或置信區間,以量化預測的不確定性。
機率分佈描述了隨機變數所有可能取值及其對應的機率。它可以是離散的(例如二項分佈)或連續的(例如常態分佈)。
程式化標註是一種利用程式碼(例如,規則、啟發式方法或外部知識庫)自動生成訓練資料標籤的技術,以加速模型開發。
提示工程是設計與優化輸入給 AI 模型的指令,以引導模型產生更準確、符合需求的回應
提示詞注入是一種安全漏洞,攻擊者通過惡意設計的提示詞操控大型語言模型的行為,使其忽略或違反原始指令。
一種輕量級的模型適配方法,通過學習可訓練的向量嵌入來優化輸入提示,而不修改模型權重,特別適合大規模語言模型。
屬性預測是指利用機器學習模型,根據物件的特徵或結構資料,預測其物理、化學或行為特性的技術。
Prophet是由Facebook開發的時間序列預測模型,專為具有強烈季節性趨勢的商業時間序列資料設計,易於使用且具有良好的預測能力。
蛋白質交互作用網路是描述細胞內蛋白質之間物理與功能連結的圖結構,是理解生命活動與疾病機制的關鍵。
利用人工智慧技術,從蛋白質胺基酸序列推斷其三維結構,對於理解生物功能與藥物開發至關重要。
指兩個或多個蛋白質分子之間因物理接觸而產生的結合,為細胞功能的基礎。
基於度量的少樣本學習方法,透過計算支持樣本的類別原型(均值),以距離判斷查詢樣本的類別。
改進的策略梯度演算法,透過信賴域約束防止策略過大更新,提高訓練穩定性。
模型剪枝是一種減少模型大小和計算複雜度的技術,透過移除模型中不重要的權重或神經元來實現。
透過自動化演算法從多語言文本中萃取或合成的高語義相似度句子對集合,主要用於緩解跨語言任務中的資料稀缺問題。
族群穩定性指數(Population Stability Index, PSI)用於量化資料分布隨時間的變化幅度,是監控機器學習模型輸入特徵或輸出預測是否發生偏移(drift)的核心指標,PSI 越大
Python 條件與迴圈是程式設計中控制程式流程的關鍵結構,透過條件判斷決定程式碼執行路徑,並利用迴圈重複執行特定程式碼區塊,實現複雜邏輯。
Python 串列(List)是一種有序、可變的資料結構,用於儲存一系列元素;字典(Dictionary)則是一種鍵值對(Key-Value)的資料結構,用於快速查找和存取資料。
一種無模型的強化學習演算法,透過估計狀態-行為對的價值函數來找到最優策略。
QLoRA是LoRA的改進版,使用4位量化技術壓縮預訓練模型,進一步降低記憶體需求,實現在消費級硬體上微調大型模型。
模型量化是一種降低模型大小和加速推論的技術,透過減少模型權重和激活值的精度來實現。
在模型訓練過程中模擬量化效果的方法,通過學習量化帶來的誤差來優化模型性能,相比訓練後量化能保持更高精度。
量子化學預測利用機器學習模型預測分子的電子性質與化學反應,有效加速新藥開發與材料科學研究的進程。
結合量子計算與機器學習的跨領域技術,利用量子力學原理加速數據處理與模式識別過程。
在主動學習中訓練多個模型,選擇它們預測意見分歧最大的樣本進行標籤,以高效識別決策邊界。
查詢擴展是信息檢索中的一種技術,通過添加同義詞、相關詞或變體詞到原始查詢中,提高檢索的回召率和搜索結果的相關性。
查詢重寫是將使用者原始輸入轉換為更精確檢索字串的技術,能解決詞彙不匹配問題,提升搜尋結果準確度。
問答系統是一種利用電腦程式自動回答人類提出的問題的技術,旨在提供快速、精確的資訊檢索和知識獲取。
等待處理的任務或請求數量,是衡量系統負載與響應能力的重要指標。
判定係數(R-squared)衡量模型解釋目標變數變異的比例,數值介於 0 到 1 之間
放射醫學AI利用人工智慧技術分析醫學影像,輔助醫生診斷疾病,提高診斷效率和準確性,並減少人為錯誤。
隨機森林是一種集成學習演算法,透過多棵決策樹投票,以隨機子集資料和特徵進行訓練,提升預測準確性
隨機遮蔽是隱藏部分資料的自監督技術,迫使模型從剩餘資訊推斷缺失內容,以提升特徵提取與泛化能力。
隨機過採樣(Random Oversampling)是處理類別不平衡問題的技術,透過隨機複製少數類別的現有樣本,使各類別的訓練樣本數趨於平衡,讓模型對少數類別有足夠的學習機會,但有增加過擬合風險的疑慮
隨機搜尋是一種超參數最佳化方法,它在預定義的超參數空間中隨機選擇參數組合,並評估其性能,以找到最佳的超參數配置。
處理類別不平衡資料的技術,從多數類別中隨機移除樣本,使各類別數量趨於平衡。
排序是信息檢索系統的核心功能,指根據相關性、質量、流行度等指標,將檢索結果按優先級排列,使用戶最快找到需要的信息。
一種控制請求頻率的機制,防止系統過載或濫用,確保服務穩定性與資源公平分配。
基於三元組的網頁語義描述標準,使用主體-謂語-賓語結構表達信息。
ReAct框架是一種結合推理(Reasoning)和行動(Acting)的AI Agent框架,允許模型在解決問題的過程中進行思考、規劃和執行。
要求模型跨越字面意義,透過邏輯推演與跨段落分析,推導出未明示結論的進階自然語言處理技術。
Real指真實世界資料或物理環境,作為生成式AI判別真偽的基準,或強化學習訓練後最終部署落地的目標場景。
真實分佈是指母體資料在客觀現實中的機率分佈狀態,是機器學習與統計模型致力於逼近與學習的終極目標。
即時推論是指模型在接收到單個輸入後立即進行預測,適用於需要快速響應的應用,例如線上推薦或詐欺檢測。
推理能力是指AI系統基於已知資訊和規則,進行邏輯推導,得出結論或解決問題的能力。是AI模擬人類智慧的關鍵組成部分。
召回率衡量模型在所有實際正例中,成功識別出多少正例的能力,反映其查找完整性的指標
以 FPR 為 X 軸、TPR 為 Y 軸畫出的曲線,展示模型在不同分類門檻下的權衡
倒數排名融合是一種無需依賴絕對分數的結果融合技術。它透過計算文件在多個獨立檢索系統中排名的倒數並進行加總,藉此產生綜合多方結果的最終排名。
衡量AI系統在理解和識別輸入資料(如圖像、語音、文本)時的準確性與可靠性。高辨識品質是確保模型效能和應用成功的關鍵。
利用圖資料結構模擬使用者與物品間的複雜互動關聯,藉由捕捉高階網路拓樸特徵以提升推薦精準度與多樣性。
推薦系統是一種利用演算法預測使用者對物品偏好的資訊過濾系統,旨在幫助使用者發現感興趣的內容,並提升平台互動與銷售。
自動編碼器等生成模型將輸入資料壓縮後再還原,還原結果與原始輸入之間的差異量。
修正線性單元是一種激活函數,其核心特徵為保留正值並將負值歸零,藉此加速計算並避免梯度消失
循環神經網路是一種具備「記憶」功能的神經網路,其能處理序列資料,並將前一步的輸出回饋至下一步
具有時序記憶能力的神經網路,透過隱藏狀態將過去的資訊傳遞至當前時步。
紅隊演練是一種模擬攻擊的測試方法,通過模擬真實攻擊者的行為,評估AI系統的安全性,找出潛在的漏洞和弱點。
正則化是一種在機器學習中用於防止模型過度擬合的關鍵技術,它透過在損失函數中引入懲罰項,有效限制模型參數的複雜度,從而提升模型的泛化能力。
強化學習是一種讓 AI 透過與環境互動,從獎勵和懲罰中學習,進而找到最佳行動策略的方法
關係抽取旨在自動識別文本中實體之間的語義關係,例如「出生於」或「工作於」,是知識圖譜構建的關鍵技術。
學習查詢樣本與支持樣本之間的相似度函數,透過神經網路端到端預測樣本間的關係。
電腦視覺模型在分佈偏移、對抗攻擊、不確定性估計等挑戰下維持穩定預測品質的能力評估框架。
線性整流函數(Rectified Linear Unit, ReLU)是深度學習中最常用的激活函數,將負值輸出設為零、正值保持不變,有效解決梯度消失問題並加速神經網路收斂。
遙感技術是從遠處獲取地球表面資訊的科學與藝術,不直接接觸目標。
在生成過程中對已經出現的詞彙施加機率懲罰,抑制模型重複使用相同詞彙或短語,提高文本多樣性。
每秒請求數 (RPS) 衡量系統每秒處理請求量,是評估 AI 模型部署與 API 服務效能的關鍵指標。
重排序模型是一種在初步檢索後,對候選結果進行重新排序的技術,旨在提升檢索結果的相關性和準確性,通常使用更複雜的模型。
殘差網路 (ResNet) 是一種深度神經網路架構,透過引入殘差連接來解決深度網路的梯度消失問題,允許訓練非常深的網路。
ResNet是一種深度學習模型,透過引入殘差連接解決深度神經網路訓練時的梯度消失問題,允許網路學習殘差映射而非直接映射。
負責任AI是一種全面性的框架,旨在確保人工智慧系統的開發、部署與使用過程,能嚴格遵守倫理原則、社會價值觀和法律規範,以促進公平、透明且可信賴的AI發展。
從大規模資料庫中快速且精準地找出與使用者查詢高度相關的資訊或文件的核心技術。
檢索增強微調結合了檢索式和生成式模型的優勢,透過檢索相關資訊來增強微調過程,提升模型在特定任務上的效能。
RAG(檢索增強生成)讓 AI 回答問題前先查詢外部知識庫,再結合查到的資料生成答案,大幅減少幻覺、提升回答準確性。
獎勵函數是強化學習中定義代理在特定狀態下採取特定動作後獲得的獎勵的函數,用於引導代理學習期望行為。
一種在強化學習系統中出現的現象,指智能體發現並利用獎勵函數的漏洞或意外行為來獲得高分,而不是實現設計者的實際目標。這種遺漏通常源於獎勵函數與真實目標之間的不完全對齐。
獎勵建模是訓練AI模型以預測人類對不同結果的偏好,用於強化學習中,引導模型學習符合人類價值的行為。
修改強化學習的獎賞函數以加快收斂和改進學習效率的技術。
以紅(Red)、綠(Green)、藍(Blue)三原色疊加表示顏色的加法混色模型,是數位影像與電腦視覺任務中圖像表示的基礎格式。
在線性迴歸損失函數中加入 L2 懲罰項以限制係數大小,防止過擬合的監督學習方法。
環狀注意力是一種分散式注意力機制,將注意力計算分散到多個設備上,減少單一設備的記憶體需求,適用於超大型模型。
結合強化學習與電腦視覺技術,讓代理程式透過與環境互動及獲得獎勵,學習解決動態且需序列決策的視覺任務。
將強化學習技術應用於自然語言處理任務中,透過獎勵機制優化文本生成的序列決策過程。
人類回饋強化學習(RLHF)是一種利用人類回饋訊號,訓練強化學習模型,使其行為更符合人類偏好的方法。
透過可客觀驗證的獎勵信號(如數學題正確答案)訓練語言模型推理能力的強化學習方法。
使用梯度平方的指數加權移動平均調整學習率的最佳化演算法,改進了 AdaGrad 學習率單調遞減的問題。
利用計算方法預測RNA分子單鏈內鹼基配對形成的二級結構,對於理解RNA功能至關重要。
機器人理財顧問是一種使用演算法和人工智慧來提供自動化投資建議和管理服務的平台,旨在降低投資門檻和成本。
機器人學習是指讓機器人透過感測資料與互動經驗,自主學習新技能與適應環境的技術。
使機器人能像人類一樣感知並理解周遭環境的技術,透過影像處理與分析,執行導航、辨識、操作等任務。
RPA(機器人流程自動化)用軟體機器人模擬人類操作電腦,自動執行重複性業務流程,廣泛應用於金融對帳、訂單處理、HR 入職等高量重複性作業。
機器人學是設計、建造、操作和應用機器人的科學和工程學科,涉及機械工程、電子工程、電腦科學等多個領域。
使用中位數與四分位距進行特徵縮放的預處理方法,對離群值不敏感,適合含極端值的資料集。
穩健性是指模型在面對輸入數據的微小擾動、對抗性攻擊或分布偏移時,仍能維持其性能表現的能力。
接收者操作特徵曲線(Receiver Operating Characteristic Curve)是以偽陽性率為橫軸、真陽性率為縱軸,透過改變分類閾值所繪製的曲線,用於評估二元分類模型在不同閾值下的
透過改變分類閾值,以真陽性率(召回率)為縱軸、假陽性率為橫軸繪製的曲線,用於評估二元分類模型在各閾值下的辨別能力。
滾動更新是一種軟體部署策略,透過逐步替換舊版實例為新版實例,確保系統在升級期間保持零停機,維持服務的高可用性。
均方根誤差是均方誤差開根號後的數值,代表模型預測值與實際值之間差值的集中程度,單位與原始資料相同
一種位置編碼方法,通過複數旋轉操作將位置信息編碼到注意力機制中,相比絕對位置編碼具有更好的外推性能。
ROUGE評分是一種用於評估自動文本摘要或機器翻譯品質的指標,通過比較生成文本與參考文本的n-gram重疊程度來衡量。
規則提取是從機器學習模型中提取人類可理解的規則的過程,旨在提高模型的可解釋性和可信度。
函數曲面上在某方向為局部最大值,在另一方向為局部最小值之點,形似馬鞍。在最佳化中,理解收斂行為的關鍵概念。
一種透過稀疏性約束學習高維資料中可解釋潛在特徵的神經網路架構,近年廣泛應用於語言模型的可解釋性研究。
在強化學習訓練過程中加入安全約束,確保智能體的行為不違反安全界限。
透過對不同訓練樣本動態調整梯度估計策略,在保持訓練穩定的前提下提升收斂效率的機器學習優化技術。
顯著性地圖是一種圖像處理技術,用於突出顯示圖像中最引人注目的區域。它通過計算每個像素的顯著性得分來實現,得分越高表示該區域越顯著。
自動識別並分割影像中最吸引人類視覺注意的區域,常應用於影像縮略圖生成與視覺注意力研究。
資料收集過程中某些群體被系統性地過度或不足代表,導致樣本無法真實反映目標母體的問題。
一種利用雷達信號合成高解析度影像的遙測技術,可穿透雲層與夜間作業,廣泛應用於 AI 地球觀測任務。
處理合成孔徑雷達影像,提取地物資訊,應用於環境監測、災害評估等領域。
針對需要空間位置理解的 AI 模型,設計能有效擴展至大規模資料與計算量的訓練框架與方法。
規模指AI系統中模型參數、訓練資料與運算資源的量級。擴展規模可顯著提升效能,是推動大型語言模型突破的關鍵因素。
水平擴展是透過增加伺服器節點來分散系統負載的架構策略,常用於提升模型部署與分散式運算的處理能力。
透過計算查詢與鍵的點積並進行縮放,以決定序列中特徵間的關聯權重,是提取上下文資訊的關鍵深度學習機制。
規模定律描述了模型性能如何隨著模型大小、訓練數據量和計算資源的增加而變化。它提供了一種預測模型性能的經驗關係。
將圖像轉換為結構化圖形的電腦視覺技術。節點代表物件,邊緣表示物件間的關係,賦予機器深度的場景理解力。
識別並映射不同資料源之間語義等效的資料元素,以實現資料整合與互通。
綱要演進是指資料庫或資料倉儲的綱要隨著時間推移而發生的變更,以及管理這些變更的過程,以確保資料的相容性和可用性。
將非結構化文本與結構化數據庫或本體進行對齊,實現兩者的語義關聯。
AI驅動科學發現指利用人工智慧技術加速科學研究流程,涵蓋假設生成、實驗設計、資料分析與結果驗證,大幅提升各學科創新效率與發現速度。
通過學習數據分佈的梯度(評分函數)來生成數據的生成模型,使用評分匹配目標直接建模數據分佈的梯度。
在主成分分析(PCA)中,以折線圖呈現各主成分解釋變異量的視覺化工具,用於判斷應保留的主成分數量。
季節性分解是一種時序分析技術,將時間序列分解為趨勢、季節性、週期性和殘差等成分,以便更好地理解和預測資料。
識別時間序列資料中重複出現的週期性模式,如每日、每週或每年循環。
Meta提出的大規模基礎模型,能對任意圖像進行實例分割,採用提示工程實現靈活的互動式分割。
衡量圖像分割任務中預測區域與真實區域重疊程度的指標。
AI中的「自」機制涵蓋自監督學習、自我注意力與自我對弈,強調模型利用自身資訊或內部關聯進行學習。
自注意力是一種機制,讓序列中的每個元素計算彼此關聯度,藉此捕捉序列內部的依賴關係
深度學習中根據序列內不同位置的相關性動態分配權重的機制,通過計算查詢(Query)、鍵(Key)、值(Value)的交互,使模型能關注序列中任意位置的信息,無視距離限制。
自我對弈是一種強化學習技術,其中智能體與自身的副本進行對弈,從而學習和改進策略,無需外部人類或標記數據。
從未標注資料中自動建立監督信號以訓練模型的學習範式,無需人工標注。
語義分析旨在理解文本的真實含義,超越字面解釋,提取句子或段落的深層語義結構和關係,賦予機器理解語言的能力。
將文字或概念轉換為連續向量空間中數值表示的技術,讓機器能理解並比較資料間的深層意義關聯與相似度。
Semantic Kernel是一個輕量級的開源SDK,使您可以將大型語言模型(LLMs)與傳統程式語言(如C#、Python)整合,建立AI應用。
語意解析是將自然語言文本轉換為機器可讀的邏輯形式或結構化表示的方法,使電腦能精確理解人類意圖。
自動識別句子中的謂詞與其論元,並為每個論元標注其語義角色(如施事者、受事者、地點)。
語義搜尋是一種理解使用者搜尋意圖和上下文的搜尋技術,超越了關鍵字匹配,旨在提供更相關和精確的搜尋結果。
對圖像中每個像素進行類別標記,將整張圖像分解為具有語義意義的區域的電腦視覺任務。
語義空間是將詞彙、句子或文件轉換為多維連續向量的數學模型,使電腦能計算語言的意義相似度與深層關聯。
自然語言處理系統能夠理解文字背後的含義與上下文關係的能力。
使用標準化機制(如RDF、OWL)將網頁內容轉化為機器可理解的結構化形式。
半監督學習是一種機器學習方法,它結合了少量標記資料和大量未標記資料進行模型訓練,旨在利用未標記資料提升模型效能,降低標記成本。
指將感測器收集的原始訊號,透過濾波、校正與特徵提取,轉化為AI模型可用的結構化數據。
感測器融合是整合多個異質感測器資料的技術,旨在消除單一硬體盲區,提供更精確且可靠的環境感知能力。
將整個句子編碼為固定維度的向量,使語義相似的句子在向量空間中距離較近。
SentencePiece 是一種獨立於語言的分詞器,它將輸入視為 Unicode 字符序列,並使用 BPE 或 Unigram 算法生成詞彙表。
情感分析是一種自然語言處理技術,用於識別和提取文本中的主觀情感,例如正面、負面或中性情緒,應用於輿情監控、客戶回饋分析等。
金融情緒分析利用自然語言處理技術,分析新聞、社群媒體等文本數據,提取市場情緒,用於預測股價、風險管理和交易策略。
Seq2Seq模型是一種將一個序列轉換為另一個序列的深度學習模型,廣泛應用於機器翻譯、文本摘要、語音辨識等任務。
序列比對是計算生物學技術,用於找出生物序列間的相似區域,揭示演化關係或功能同源性。
將輸入序列中的每個元素映射到對應標籤的 NLP 任務類型,如命名實體識別、詞性標注、語音辨識等。
序列建模是深度學習領域處理具時間或順序依賴性資料的技術,旨在理解、預測或生成序列模式。
使用編碼器-解碼器架構將一個序列轉換為另一個序列,廣泛應用於翻譯、文本摘要等。
序列異常偵測是一種從具有時間或先後順序的資料中,找出不符合預期模式或異常行為的分析技術。
無伺服器機器學習是一種雲端運算模型,允許開發者在無需管理伺服器的情況下構建、訓練和部署機器學習模型,按實際使用量付費。
基於會話推薦利用使用者單次瀏覽會話內的行為序列,預測使用者下一步可能感興趣的項目,無需使用者歷史資料。
使用人工標注的高品質示範資料,對預訓練語言模型進行有監督訓練以使其遵循指令的技術。
一種廣泛使用的密碼學雜湊函數,將任意長度資料轉換為固定256位元雜湊值。
影子部署是一種零風險的部署方式,新版本與舊版本同時運行,使用者只看到舊版本的結果,新版本的預測結果被記錄但不返回,用於離線評估新版本的實際性能。
影子模式是指將新模型部署於生產環境,接收真實流量並進行預測,但預測結果不影響實際業務決策的評估策略。
基於賽局理論 Shapley 值,量化每個特徵對模型單一預測結果貢獻度的可解釋 AI 方法。
基於Shapley值的機器學習模型解釋方法,公平分配每個特徵對預測結果的貢獻。
SHAP 是一種基於賽局理論 Shapley 值的模型解釋方法,用於量化各特徵對模型預測的貢獻程度
將不同模態資料映射到同一向量空間,使它們可相互比較與理解。
連體神經網路是一種包含兩個或多個共享相同權重的相同神經網路的架構,用於比較輸入之間的相似性或關係。
Sigmoid 函數是一種將任意實數壓縮到 (0, 1) 區間的 S 形曲線,公式為 σ(x) = 1/(1+e⁻ˣ),常作為神經網路的激活函數及邏輯斯迴歸的輸出層,用於將線性輸出轉換為機率值。
S 型函數能將任何數值壓縮至 0 到 1 之間,常用於二元分類模型,將輸出結果轉換為機率
評估非監督式分群品質的指標,衡量每個樣本與所屬群集的緊密程度相對於鄰近群集的分離程度,數值範圍為 -1 到 1。
模擬至實轉移是一種將在模擬環境中訓練的模型應用到真實世界的方法,旨在克服模擬與現實之間的差異,提升模型泛化能力。
模擬加速是一種結合人工智慧與計算科學的技術,用於在保持合理精確度的前提下,大幅縮短複雜系統模擬所需的時間。
奇異值分解(SVD)是一種將矩陣分解為三個矩陣乘積的技術,廣泛應用於降維、推薦系統和資料壓縮等領域。
直接連接網路中相隔若干層的神經元,允許梯度和信息跳過中間層流通,改善深層網路的梯度流動和訓練穩定性。
在序列資料上以固定大小的視窗逐步滑動取樣的技術,廣泛用於時間序列分析、NLP 和語音處理。
一種高效的注意力機制,限制每個位置只與一個固定大小的局部上下文窗口內的位置進行注意力計算,減少計算複雜度。
槽位填充是自然語言理解中的一項任務,旨在從文本中提取特定資訊,並將其填入預定義的槽位中,以形成結構化資料。
SMOTE 是一種處理資料不平衡問題的過採樣技術,透過合成少數類別樣本來平衡資料分佈,提升模型學習效果。
透過在少數類樣本的特徵空間中插值生成合成樣本,以緩解類別不平衡問題的過採樣技術。
社群網路分析是利用圖論與網路理論探討實體間關係特徵的方法,常被用於發掘意見領袖與偵測資訊流動路徑。
Softmax 函數是一種將數值轉換為機率分佈的數學工具,常用於多元分類模型,確保輸出總和為一
SPARQL是一種用於查詢和操作RDF資料的查詢語言,類似於SQL用於關係資料庫。它允許使用者從知識圖譜中提取特定資訊。
稀疏注意力機制是一種減少注意力機制計算複雜度的技術,透過只關注輸入序列中的部分元素,降低運算量,提升模型效率。
稀疏檢索是一種資訊檢索方法,它使用稀疏向量來表示查詢和文檔,向量中的非零元素通常表示詞彙的存在或重要性。
稀疏變換器是一種深度學習架構,透過限制注意力機制的計算範圍降低複雜度,使其能高效處理長序列資料。
稀疏性約束是一種在機器學習中,強制模型參數或內部表示包含更多零值的正則化技術,以降低運算成本。
語者分段旨在識別音訊中不同語者的發言時間段,並將其區分開來,無需事先知道語者身份。
時頻表示,將音訊訊號分解為時間與頻率的二維矩陣,視覺化與分析訊號特徵的基本工具。
推測解碼是一種加速大型語言模型推論速度的技術,透過小型模型預測多個token,再由大型模型驗證,減少計算量。
語音辨識是一種將人類語音轉換為機器可理解的文字或指令的技術,使電腦能夠聽懂並處理人類語言。
語音合成技術是一種將文字轉換成人類語音的技術,也稱為文字轉語音(TTS)。它廣泛應用於語音助理、導航系統和輔助科技等領域。
拼寫校正是一種自動偵測並修正文本中拼寫錯誤的技術,旨在提高資料品質、增強搜尋精準度與改善使用者體驗。
脈衝神經網路屬於第三代人工神經網路,模仿生物大腦透過離散的脈衝訊號進行資訊傳遞,具備極低的功耗與高時間解析度優勢。
競價型訓練利用閒置的雲端運算資源,以大幅降低模型訓練成本,但可能因資源回收而中斷。
Stable Diffusion 是一種潛在擴散模型,用於根據文字描述生成高質量圖像,透過迭代去噪過程,從隨機噪聲中產生逼真圖像。
多層集成架構,用多個基礎模型的輸出作為新特徵訓練元模型,捕捉基礎模型的複雜交互。
利害關係人參與是指在人工智慧開發過程中,主動納入受影響群體的意見,以確保系統符合社會價值。
衡量資料集各數值與平均值之間平均離散程度的統計指標,反映資料的變異性。
狀態機模型是一種計算模型,系統在任何給定時間都處於有限數量的狀態之一,並根據輸入在狀態之間轉換。
狀態空間模型是一種數學模型,用於描述系統隨時間演變的狀態。它包含狀態方程和觀測方程,廣泛應用於控制、預測和訊號處理。
詞幹提取是自然語言處理中將單詞簡化為其詞幹或詞根形式的過程,通常通過刪除後綴來實現。
逐步迴歸分析是一種特徵選擇演算法,透過反覆加入或移除自變數,建立預測目標變數的最佳統計模型。
利用立體影像對(左右視圖)的對應像素差異估計深度信息,是三維重建的基礎。
隨機梯度下降(SGD)是一種迭代優化算法,用於最小化目標函數。它每次迭代僅使用一個或少量樣本計算梯度,加速訓練過程,但可能導致收斂不穩定。
指定特殊的詞彙序列,當模型生成到此序列時立即停止生成,用於控制輸出長度和結構邊界。
確保每個折(Fold)中各類別樣本比例與原始資料集一致的 K 折交叉驗證變體。
分層抽樣是一種統計抽樣方法,將母體依據特定特徵劃分為互斥的子群體(層),再從各層中獨立抽樣。這確保了各層在樣本中的代表性,能有效降低抽樣誤差,特別適用於處理不平衡資料集。
用數學方程與有向無環圖表示變數間因果機制的模型,允許進行干預與反事實推理。
結構化資料是指具有預定義格式和組織方式的資料,易於儲存、查詢和分析,例如關聯式資料庫中的表格。
風格轉換是一種使用人工智慧技術,將一張圖片的風格應用到另一張圖片的內容上的方法,創造出具有新風格的圖像。
次詞單元化是將單詞拆分為更小的子單元(次詞)的技術,用於解決詞彙量過大和未登錄詞(OOV)問題,提升模型泛化能力。
繼任特徵是強化學習中的一種狀態表徵方法,用於解耦環境動態與獎勵函數,提升多任務學習效率。
超解析度重建是一種電腦視覺技術,旨在從低解析度影像重建出高解析度影像,提升影像的清晰度和細節。
超級對齊旨在確保遠超人類智慧的AI系統,其目標與人類價值觀對齊,避免潛在的失控風險。
監督式學習是一種 AI 方法,透過提供帶有正確標籤的輸入資料,訓練模型學習預測新資料的標籤
支持向量機是一種機器學習模型,透過尋找最大邊界的超平面,將不同類別的資料有效分隔
基於支援向量機原理的迴歸模型,利用間隔帶容忍小誤差,對雜訊具有一定抵抗力。
Swin Transformer是一種層級式的Transformer模型,用於電腦視覺任務,透過移動視窗機制有效降低計算複雜度,並提升模型效能。
符號推理是人工智慧中一種透過符號表示知識,並運用邏輯規則進行推論的方法,旨在模擬人類的理性思考過程。
合成數據是指通過程式或演算法生成的人工數據,而非從真實世界收集的數據。它常用於訓練AI模型,特別是在真實數據稀缺或涉及隱私問題時。
合成資料生成是指透過程式或模型創建人工資料,用於訓練機器學習模型,尤其是在真實資料稀缺或難以獲取的情況下。
系統提示詞是用於引導大型語言模型行為的初始指令,影響模型的回應風格、知識範圍和任務執行方式。
T5 (Text-to-Text Transfer Transformer) 是一種將所有 NLP 任務轉換為文本到文本格式的轉換器模型,簡化了模型訓練和應用。
將類別特徵替換為該類別對應的目標變數統計量(通常是條件平均值)的特徵工程技術。
訓練模型時,不小心納入在預測時無法獲取的未來或結果資訊,導致模型過度樂觀。
元學習中,多個相關任務的集合及其統計特性的抽象,定義了『哪些任務相關』及『任務多樣性如何』。
透過調整溫度參數,控制語言模型生成文本的隨機程度和多樣性。溫度越低生成越確定,溫度越高生成越隨機。
時間抽象化將一連串底層動作封裝為高階技能,使強化學習模型能在更長的時間尺度上決策與規劃。
在視頻中精確識別和定位動作發生的時間段,給出動作開始和結束的時間戳。
使用擴張卷積取代遞迴層捕捉時序依賴的網路架構,支援高度並行化。
時序差分學習是一種強化學習方法,透過預測未來獎勵並更新預測值,從不完整的序列中學習,無需等待完整結果。
時序點過程是一種用於建模非連續事件發生時間的統計工具,特別適用於分析事件之間的時間依賴性與相互作用。
將單個張量(矩陣或更高維數組)的計算分割到多個 GPU 設備上,通過跨設備並行計算矩陣乘法等操作的分佈式訓練方法。
衡量一個詞對文件的重要性:在這篇文件中出現多(TF 高)但在其他文件中少見(IDF 高)的詞最重要
測試資料集用於評估模型在未見過資料上的泛化能力,是模型效能的最終指標,在模型部署前使用。
測試時運算是指在模型部署後,進行推論時所使用的運算資源。目標是在效能和延遲之間取得平衡,以滿足實際應用需求。
文本分類是自然語言處理中的一項任務,旨在將文本自動分配到預定義的類別中。它應用廣泛,例如垃圾郵件檢測、情感分析等。
指引AI模型生成內容的文字指令或問題,是與生成式AI互動的核心方式。
文本摘要是自然語言處理中的一項任務,旨在從一篇或多篇文章中生成簡潔且信息豐富的摘要。分為抽取式和生成式兩種方法。
文字生成3D模型是指利用人工智慧技術,將文字描述轉換為對應的3D模型,實現從文字到視覺化模型的自動生成。
文字轉語音(TTS)是一種人工智慧技術,能將書面文字精準地轉換為自然流暢且富有表現力的人類語音,廣泛應用於語音助理、有聲書和無障礙輔助等領域。
文字生成圖像是一種人工智慧技術,它能根據文字描述自動生成對應的圖像,實現文字內容的視覺化呈現。
透過輸入自然語言描述,利用深度學習模型自動合成出符合語意內容與風格之圖像的多模態技術。
文字轉語音 (TTS) 技術將文字轉換為人類可理解的語音。它廣泛應用於輔助工具、語音助手和內容創作等領域。
文字生成影片是一種人工智慧技術,它能根據文字描述自動生成對應的影片,將文字內容轉化為動態視覺呈現。
文本蘊含是判斷一段前提文本是否能邏輯推導出另一段假設文本的自然語言處理任務,廣泛應用於問答系統與事實查核。
TF-IDF 是信息檢索和文本挖掘中的經典特徵提取方法。它通過計算詞的局部重要性(TF)和全局重要性(IDF)的乘積,評估詞在文檔中的相關性。
AI 模型透過顯式的中間推理步驟(思維鏈)將複雜問題拆解為可逐步解決的子問題,以提升多步推理任務準確率的方法。
改變分類模型的決策閾值來權衡精確率和召回率的技術,預設閾值通常為 0.5,調整閾值可適應不同業務需求
時間序列分析是研究按時間順序排列的數據點序列,以識別模式、趨勢和週期性,並預測未來值。
基於歷史時序資料的統計規律,預測未來特定時間點或時間段的數值的技術。
符記是大型語言模型處理文字時,不可分割的最小單位,它可以是一個字、詞,或者更小的子詞
分詞是自然語言處理(NLP)中的基礎步驟,旨在將連續的文本序列拆解成更小的、具有語義意義的單元,例如詞彙、子詞或字符,這些單元稱為 tokens。
將文本分割成詞元(tokens)的工具,詞元可以是詞、子詞或字符,是 NLP 模型的輸入預處理步驟。
工具使用能力是指大型語言模型利用外部工具(例如API、資料庫)來擴展其功能,完成更複雜任務的能力。
為降低自注意力複雜度的技術。透過僅保留分數最高的前 K 個鍵值對參與計算,有效減少記憶體與運算開銷。
限制每次詞彙選擇只從機率最高的 k 個候選詞彙中進行隨機採樣,減少低機率詞彙被錯誤選中的風險。
張量處理單元(TPU)是Google專為加速機器學習工作負載而設計的客製化硬體加速器,尤其擅長處理張量運算,是深度學習的利器。
訓練集是用於訓練機器學習模型的資料集,模型通過學習訓練集中的模式和關係來提升預測能力。
軌跡最佳化是機器人學與控制領域的關鍵技術,旨在規劃出滿足特定約束條件並最佳化預設目標函數的運動路徑。
軌跡預測是基於實體歷史移動數據,推斷其未來路徑的技術,常見於自動駕駛、機器人導航等時序分析應用。
遷移學習是將已在大數據集習得的知識,轉移應用至小數據集的新任務,藉此加速模型訓練
AutoML遷移學習利用預訓練模型知識,加速AutoML流程,減少訓練數據需求,提升模型泛化能力,並降低計算成本。
完全基於 Attention 機制的架構,不用 RNN 的循環結構,能平行處理整個序列
將Transformer架構應用於時序資料,利用自注意力捕捉時間依賴,在預測任務上取得優異成績。
指在AI系統開發與運作中,適當揭露資料來源、模型設計與決策邏輯,讓利害關係人能理解並評估系統行為。
將時間序列資料拆解為趨勢、季節性與殘差成分,以揭示其潛在模式。
三元組抽取是從文本中提取(主語,謂語,賓語)三元組的過程,是構建知識圖譜的基礎,也是關係抽取的一種形式。
分類模型正確預測為「負類」的樣本,模型預測與真實標籤皆為陰性。
分類模型將實際為正例的樣本正確預測為正例的情況,是混淆矩陣四格中最理想的預測結果之一。
截斷技巧是一種在生成式模型中,透過限制潛在向量採樣範圍來提升生成品質的策略,主要用多樣性來換取更高的影像或資料保真度。
一種策略梯度方法,透過限制策略更新的範圍以保證單調性改進的強化學習算法。
U-Net是一種用於圖像分割的深度學習模型,其架構呈U型,包含編碼器和解碼器,能有效捕捉圖像的上下文資訊和精確定位分割邊界。
在主動學習中選擇模型預測信心度最低的樣本進行標籤,以優先改進模型的薄弱決策邊界。
欠擬合指模型過於簡單,無法捕捉資料中的主要規律,訓練集與測試集的預測表現皆不理想
一種在 AI 生成任務中整合結構化知識圖譜或外部知識庫以引導生成方向,同時優化輸出一致性與事實準確性的統一框架架構。
非結構化資料是指沒有預定義格式或組織方式的資料,難以直接儲存和分析,例如文字、圖像、音訊和影片。
非監督式異常偵測技術無需標註資料,能自動學習數據的常態模式,有效辨識出偏離預期特徵的罕見異常事件。
非監督式學習是機器學習方法,讓模型在沒有標籤的輸入資料中,自行探索隱藏的結構與模式
將任務委託給能自主規劃、調用工具並反覆執行步驟的 AI Agent 來完成目標的應用範式。
驗證資料集用於在模型訓練期間調整超參數和評估模型效能,以防止過擬合,並選擇最佳模型。
梯度消失是指在深度學習模型訓練中,梯度在反向傳播時逐漸縮小至接近於零,導致淺層網路權重難以更新,模型學習停滯。
變分自編碼器(VAE)是一種生成式深度學習模型,它將輸入資料壓縮成潛在空間中的機率分佈,並能從中採樣以生成多樣化且具代表性的新資料樣本。
將貝葉斯推論問題轉化為最優化問題,用易於計算的分布逼近複雜的後驗分布。
向量資料庫是一種專門儲存和檢索向量嵌入的資料庫,能高效處理高維度資料的相似性搜尋,廣泛應用於推薦系統和語義搜尋。
一種結合語義與實例分割的電腦視覺技術,能對影片中每個像素進行精確的物件類別與個體識別追蹤。
AI 模型分析並理解視頻內容的能力,包括識別物體、動作、場景和事件發展過程。
結合電腦視覺與自然語言處理的跨學科領域,使人工智慧系統能夠同時理解、對齊並處理影像與文字資訊。
Vision Transformer (ViT) 是一種將 Transformer 架構應用於圖像識別的深度學習模型,它將圖像分割成小塊,並將其視為序列進行處理。
視覺語言模型結合電腦視覺與自然語言處理,使機器能理解並生成圖像與文字之間的關聯,應用廣泛,例如圖像描述生成和視覺問答。
視覺問答(VQA)是一種人工智慧任務,要求模型根據給定的圖像回答自然語言問題,結合了電腦視覺和自然語言處理。
視覺關係檢測是一種電腦視覺技術,專注於識別影像中多個物件以及它們彼此間的空間、動作或語意互動關聯。
視覺敘事指利用連續圖像或影片傳達故事的技術。在多模態AI中,模型能將文本轉化為具連貫情節的視覺序列。
AI 生成影像或資料視覺化中的資訊誤導現象,指視覺呈現因設計選擇、生成模型偏差或操弄手法,傳遞出與事實不符或過度確信的錯誤印象。
整合視覺感知、語言理解與動作執行的多模態 AI 模型,能依據視覺輸入與語言指令直接輸出機器人控制動作。
語音助理是一種使用語音辨識、自然語言處理等技術,讓人們透過語音指令與設備互動的AI系統。
聲音複製是指使用人工智慧技術,基於少量語音樣本,生成與目標人物聲音高度相似的合成語音。
將一個說話者的聲音轉換為另一個說話者聲音風格的技術,同時保持語言內容不變。
預熱訓練是一種在模型訓練初期,逐步提高學習率的策略,旨在穩定訓練過程,避免初期梯度爆炸或震盪。
在模型訓練初期逐漸增加學習率的策略,可防止模型權重在訓練剛開始時因過大的梯度更新而崩潰或發散。
使用瓦瑟施泰因距離作為損失函數的 GAN 變體,提供更穩定的梯度信號,減輕訓練不穩定性和模式崩潰問題。
在文本、影像、音訊等數位內容中隱藏的標記或訊號,用於建立所有權、追蹤來源或檢測AI生成內容。
一種時頻分析方法,通過不同尺度的小波函數分解信號,同時保留時間和頻率信息。
WaveNet是一種深度生成模型,直接對原始音訊波形進行建模,能夠生成高品質的語音和音樂,並在語音合成領域取得了顯著的成果。
弱監督學習利用不精確、不完整或帶有雜訊的標籤資料來訓練機器學習模型,降低對大量精確標註資料的依賴。
權重裁剪是一種正則化技術,透過將神經網路的權重限制在特定數值範圍內,以增強模型訓練的穩定性與收斂效果。
「權重衰減」是深度學習正則化技術,透過懲罰過大權重,防止模型過度擬合,提升泛化能力。
Whisper 是 OpenAI 開發的語音辨識系統,能將語音轉換為文字,支援多種語言,並具備良好的抗噪能力和翻譯功能。
結合廣義線性模型與深度神經網路的混合機器學習架構,同時具備記憶歷史特徵組合能力與推廣未見特徵能力的優勢。
結合寬線性模型和深度神經網絡的混合機器學習架構,寬部分用於學習特徵組合,深部分用於學習高階特徵交互,常用於推薦系統和分類任務
將詞彙映射到連續向量空間的技術,使語義相似的詞在向量空間中距離相近,是自然語言處理的基礎表示學習方法。
詞義消歧(WSD)是自然語言處理中的一項任務,旨在確定一個詞在特定上下文中的正確含義,因為許多詞具有多重含義。
詞向量(Word2Vec)是一種將詞語轉換為數字向量的技術,其核心概念是讓語意相近的詞彙在向量空間中的距離更接近
工作流程自動化是指利用技術自動執行重複性、基於規則的任務和流程,以提高效率、減少錯誤並釋放人力資源。
世界模型是一種AI模型,旨在學習環境的內部表示,使代理能夠預測未來狀態並做出更明智的決策。
衡量一個值偏離平均值幾個標準差,Z = (x - μ) / σ。常用於標準化和異常值檢測
將特徵值轉換為均值為 0、標準差為 1 的標準常態分佈的資料預處理方法。
Microsoft 提出的分布式訓練優化技術,通過將梯度、優化器狀態和模型參數分片存儲在多個 GPU 上,大幅降低記憶體占用,支持訓練超大規模模型。
零信任架構是一種安全模型,它不預設信任任何使用者或裝置,每次存取都必須驗證身分與授權
零樣本學習讓模型無需任何該類別的訓練範例,憑藉預訓練知識即可識別與處理未見過的類別