準確率 Accuracy
iPAS所有預測中正確的比例 = (TP+TN)/(全部)。類別不平衡時容易被多數類主導
瀏覽 AITerms.tw 中標籤為「AI基礎」的 AI 術語,快速找到定義、FAQ 與 iPAS 考試重點。
目前篩選:標籤「AI基礎」,共 229 個術語。
同一術語可隸屬多個主題,因此主題數量會重複計算。
主題標籤
A-Z 快速導覽
目前篩選:標籤「AI基礎」 ,共 229 個術語
清除篩選 同一術語可隸屬多個主題,因此主題數量會重複計算。
所有預測中正確的比例 = (TP+TN)/(全部)。類別不平衡時容易被多數類主導
確保資料庫交易可靠執行的四個基本屬性:原子性、一致性、隔離性與持久性,是資料處理的重要基礎。
ACID 是指資料庫交易必須具備原子性、一致性、隔離性與持久性四大特性,以確保資料處理的正確性、可靠性與完整性。
一種機器學習策略,由演算法主動選擇最具訊息價值的未標籤樣本進行標籤,以最小化標籤成本並最大化模型性能
AI 代理是能自主規劃、執行任務並運用工具的 AI 系統,它不只回答問題,更能實際採取行動
AI治理是指建立一套框架和流程,以確保AI系統的開發和使用符合倫理、法律和社會價值觀。
演算法是一組定義明確的指令,用於解決特定問題或執行特定任務。它接收輸入,經過一系列步驟處理,並產生輸出。
演算法問責制指確保人工智慧與自動化系統之設計、開發及部署過程具備透明度、公平性及可解釋性,並在產生損害時明確劃分相關責任歸屬的機制。
模型在對齊(使其行為符合人類價值觀)過程中可能損失的性能,特別是在某些原始能力上的下降。
指代消解是自然語言處理中的一項任務,旨在確定文本中代詞或其他指稱語所指代的先行詞,以理解文本的完整含義。
變異數分析 (ANOVA) 是一種統計方法,用於比較兩個或多個群體的平均數是否存在顯著差異。它將總變異分解為不同來源的變異。
API閘道是位於應用程式前端的伺服器,作為單一入口點處理所有API請求,提供路由、驗證、授權、限流、監控等功能。
ARIMA是一種廣泛使用的時間序列預測模型,結合了自迴歸、差分和移動平均三個部分,用於分析和預測時間序列資料。
通用人工智慧(AGI)是指具備與人類同等或超越人類的智慧,能夠理解、學習、適應並在任何智力任務中表現出色的AI系統。
人工智慧是模擬人類認知能力的電腦技術,透過機器學習與深度學習讓系統能自主學習與決策
注意力可視化是一種技術,用於呈現神經網路模型在處理輸入時,將注意力集中在哪些部分。它能幫助理解模型決策過程,並診斷潛在問題。
利用音頻和視覺信息的相關性,訓練神經網絡進行特徵學習的方法,通常不需要人工標籤。
自動擴展根據系統負載自動調整計算資源,動態增加或減少伺服器數量,確保應用程式效能,同時優化成本。
自編碼器是一種神經網路,旨在學習輸入數據的壓縮表示(編碼),然後從該壓縮表示重建原始數據(解碼)。
自主系統是指能在沒有外部干預下,感知環境、做出決策並執行動作的系統,具備一定程度的獨立性和適應性。
詞袋模型是一種簡化文本表示的方法,忽略詞語的順序和語法結構,僅統計每個詞語在文本中出現的次數,形成詞頻向量。
貝氏定理描述在已知一些條件下,事件發生的機率。它基於先驗機率、條件機率和證據,更新對事件的信念。
模型基準測試是一套標準化的評估任務與資料集,用來客觀衡量並比較不同 AI 模型的各項性能與實際能力。
基準測試是用於評估和比較不同AI模型、演算法或系統性能的標準化方法,提供客觀的性能指標。
識別和減少機器學習模型中存在的各種偏見,確保 AI 系統的公平性和非歧視性
雙語評估替代指標(BLEU,Bilingual Evaluation Understudy)是機器翻譯品質評估的自動化量化指標,透過比對機器翻譯輸出與人工參考譯文中 n-gram 的重疊程度,給出 0
BM25 (Best Matching 25) 是一種用於資訊檢索的排序函數,它基於詞頻和逆文檔頻率,並考慮了文檔長度的影響,以提高檢索的準確性。
指從開始到完成AI模型或軟體專案建置過程所需的時間。
衡量AI模型或軟體專案建置過程中失敗次數佔總次數的比例。
膠囊網路是一種神經網路架構,旨在解決卷積神經網路在處理物件方向和空間關係上的不足,透過膠囊和路由機制,更有效地捕捉物件的層次結構。
神經網路在學習新知識時快速遺忘舊知識的現象,導致之前習得的能力消失。
機器學習中取值為有限離散類別的特徵,如性別(男/女)、顏色(紅/綠/藍)、地區等,需要特殊編碼才能用於模型訓練
因果推論是從觀察數據中推斷因果關係的方法,旨在確定一個變數的變化是否直接導致另一個變數的變化。
中央極限定理指出,大量獨立隨機變數的總和(或平均值)趨近於常態分佈,與原始變數的分佈無關。是統計推論的基石。
思維鏈提示是一種Prompt工程技術,透過引導模型逐步推理,提升複雜問題的解答品質與可解釋性。
卡方檢定是一種統計方法,用於檢驗兩個或多個類別變數之間是否存在顯著關聯性。它比較觀察值與期望值之間的差異。
分塊處理是指將大型資料集或文本分割成更小、更易於管理的部分,以便於模型處理和分析,提升效率。
公民開發者是指,能運用低程式碼(LCNC)平台,開發應用程式的非資訊背景專業人士
完形填空任務是一種語言理解測試,透過移除文本中的部分詞彙,要求模型或人類填補缺失部分,以評估其對上下文的理解能力。
常識推理是賦予人工智慧運用人類日常生活基礎知識進行邏輯判斷的能力,使其能對未明言情境做出合理推斷。
概念瓶頸模型是一種深度學習模型,它強制模型通過人類可理解的概念來進行預測,從而提高模型的可解釋性和可控性。
衡量數學問題或演算法對輸入微小變化的敏感程度。
一種對齐大型語言模型的方法,透過編制一份「憲法」(一組原則和價值準則),指導 AI 系統自我批評和改進行為,無需依賴大量人類反饋,實現更可控且價值對齐的 AI 系統。
容器化技術是一種將應用程式及其所有依賴項打包到一個可移植容器中的技術,實現跨環境一致的部署。
有效利用 LLM 的上下文窗口(模型能處理的最大序列長度),在有限的空間內優先放置最重要的信息,避免超長內容丟失或品質下降。
持續學習旨在使AI模型能夠在不遺忘先前知識的情況下,逐步學習新的任務和資料,模擬人類終身學習的能力。
對比學習是一種自監督學習方法,通過學習區分相似和不相似的樣本,從而提取資料的有效表示,無需人工標註。
卷積運算是提取特徵的數學操作,透過濾波器在資料上滑動捕捉邊緣與紋理,廣泛應用於電腦視覺領域。
語料庫是大量結構化的文本集合,用於語言研究和自然語言處理,提供真實語言使用的範例,用於訓練和評估模型。
代價函數是所有訓練樣本損失函數的平均值,用於評估模型在整個訓練集上的表現,並作為優化算法的目標。
反事實解釋描述了為了改變模型預測結果,輸入數據需要做的最小變動。它提供了一種理解模型決策邏輯的方式。
交叉熵損失是一種衡量兩個機率分佈之間差異的損失函數,常用於分類任務中評估模型預測結果與真實標籤的差距。
系統從簡單任務開始,逐步學習難度遞增的任務,提升效率和收斂性。
資料是機器學習模型的學習基礎,包含結構化與非結構化形式,驅動 AI 系統發展。
資料標註是為資料集添加標籤或註解的過程,使機器學習模型能夠理解和學習這些資料,是模型訓練的基礎。
資料擴增術是一種增加訓練資料多樣性的技術,透過對現有資料進行微小的修改,創造出新的、但仍然代表相同類別的資料點,以提升模型泛化能力。
資料標註是指為原始資料添加標籤的過程,這些標籤提供關於資料的額外資訊,用於訓練監督式機器學習模型。
資料湖是一種大型集中式儲存庫,能以原始格式存放結構化、半結構化和非結構化的各式資料,提供高度彈性與可擴展性。
資料血緣追蹤記錄資料從來源到目的地的流動和轉換,提供資料的完整歷史和上下文,確保資料品質和可追溯性。
資料管線是一系列資料處理步驟,將原始資料轉換為可供分析或模型使用的格式,包含擷取、轉換、載入等階段。
資料品質監控是指持續追蹤和評估資料的準確性、完整性、一致性、時效性和有效性,以確保資料符合預期標準。
資料版本控制追蹤資料集在不同時間點的狀態,確保可重複性、可追溯性,並允許回復到先前的資料版本。
資料倉儲是針對查詢與分析優化的結構化資料儲存系統,整合多來源資料以支援商業智慧決策
決策樹是一種透過 if-else 條件判斷,將資料逐步拆解為更純粹子集的模型,具備高度可解釋性
深度學習是一種機器學習方法,透過多層神經網路自動從原始資料中提取階層特徵,解決複雜問題。
深度強化學習結合深度學習與強化學習,透過深度神經網路學習複雜策略,以在特定環境中最大化累積獎勵。
使網路中的每一層都接收所有前面層的輸出作為輸入,通過特徵複用和梯度流通改善深層網路的訓練和性能。
DenseNet是一種深度學習模型,透過密集連接每一層到所有後續層,最大化層之間的資訊流動,增強特徵重用,減少梯度消失問題。
依存句法分析是自然語言處理中,分析句子中詞彙之間的依存關係,建立句子的語法結構,揭示詞彙間的修飾、支配等關係。
數位分身是真實世界實體或系統的虛擬化身,通過收集數據進行模擬、監控和預測,以優化性能、預防故障和做出更明智的決策。
邊緣人工智慧是指在靠近資料來源的邊緣設備上執行AI運算,而非在雲端伺服器上。可降低延遲、節省頻寬、保護隱私。
高效神經架構搜尋(Efficient NAS)旨在降低NAS的計算成本,通過架構共享、代理模型等技術加速搜尋過程,找到高性能的神經網路架構。
特徵值是線性變換作用於向量後,該向量長度縮放的比例。它描述了變換對特定方向向量的影響程度。
特徵向量是指在線性變換下,方向保持不變或僅反向的非零向量。它對應於特定的特徵值,代表變換的主要作用方向。
湧現能力是指大型語言模型在達到一定規模後,突然展現出在較小模型中未曾觀察到的複雜能力,例如推理、翻譯和程式碼生成。
熵是資訊理論中衡量隨機變數不確定性的指標,數值越高代表不確定性越大。在機器學習中,熵常用於特徵選擇和決策樹構建。
可解釋 AI 透過視覺化或簡化模型,讓複雜的黑箱模型預測決策過程能被人類理解、信任與稽核。
梯度爆炸是指在深度學習模型訓練中,梯度在反向傳播時變得異常巨大,導致權重更新過大,模型訓練不穩定甚至崩潰。
探索與利用是強化學習中的權衡,探索是指嘗試新動作以發現潛在的更好策略,利用是指使用已知最佳策略以獲得最大獎勵。
指數平滑法是一系列時序預測方法,使用加權平均數,其中權重隨著時間的推移呈指數衰減,更重視近期觀測值。
Precision 和 Recall 的調和平均數 = 2PR/(P+R),兼顧「找得準」和「找得全」
量化每個輸入特徵對模型預測結果的貢獻程度,幫助理解和驗證模型的決策依據。
回饋迴路是指系統輸出影響其輸入的過程,在AI中用於迭代改進模型效能,透過評估結果並調整參數。
前饋神經網路是一種訊息單向傳播的神經網路,由輸入層、隱藏層和輸出層組成,廣泛應用於分類和迴歸任務。
閃電注意力機制是一種優化注意力計算的技術,透過重新排序計算步驟和利用硬體加速,大幅提升注意力計算的速度和記憶體效率。
基礎模型是使用大量未標記數據訓練的大型模型,可適應多種下游任務,展現出強大的泛化能力和遷移學習能力。
神經網路中每個神經元都與前一層所有神經元相連的層級,每條連接都有獨立的可學習權重,能進行高度非線性的特徵轉換,常用於網路最後階段進行分類或迴歸。
閘控循環單元(GRU)是一種循環神經網路(RNN)的變體,旨在解決傳統RNN的梯度消失問題,更有效地捕捉長期依賴關係。
基因演算法是一種模擬生物進化過程的優化算法,通過選擇、交叉和突變等操作,逐步演化出更優的解,用於解決複雜的搜索和優化問題。
指資料在多維空間的拓樸與形狀特徵,幾何深度學習利用此對稱結構處理圖論、流形與點雲等非歐幾里得資料。
圖形處理器(GPU)是一種專為並行處理設計的電子電路,最初用於加速圖像渲染,現廣泛應用於深度學習等需要大量計算的領域。
Grad-CAM是一種可視化技術,利用梯度資訊來突出顯示輸入圖像中對模型預測最重要的區域,提供模型決策的可解釋性。
梯度提升法是一種機器學習技術,透過迭代地組合弱學習器(通常是決策樹)來建立強大的預測模型,每次迭代都專注於修正前一個模型的錯誤。
使用注意力機制對圖的鄰域進行聚合的 GNN 模型,能為不同鄰居節點分配不同的權重。
將圖中的節點或邊映射到低維向量空間的技術,保留原圖的結構信息和語義關係。
一種 GNN 模型,基於圖同構測試的 Weisfeiler-Lehman 算法設計,具有較強的圖判別能力。
頓悟學習指模型在訓練初期泛化能力差,但經過長時間訓練後,突然展現出良好的泛化能力,如同頓悟一般。
LSTM的簡化版本,參數更少、訓練更快,在多數序列任務上性能相當。
圖像分類是電腦視覺中的一項任務,旨在將圖像分配到預定義的類別中。模型學習圖像特徵,並基於這些特徵預測圖像所屬的類別。
圖像識別是電腦視覺領域的一項任務,旨在識別圖像中的對象、人物、地點或事件。它比圖像分類更廣泛,可能涉及定位和標記圖像中的多個對象。
上下文學習 (In-context Learning) 指的是大型語言模型無需額外訓練,僅通過輸入範例即可學習新任務的能力。
上下文學習理論指大型語言模型無需額外訓練,僅憑藉輸入提示中的範例,即可執行新任務的能力,展現了模型泛化的潛力。
使用多分支並行卷積的架構,在同一層中採用不同大小(1×1, 3×3, 5×5)的卷積核進行特徵提取,捕捉多尺度信息。
從非結構化文本中自動識別和提取特定信息的技術,將非結構化數據轉為結構化知識。
資訊理論研究資訊的量化、儲存與傳輸,核心概念包含熵、互資訊、通道容量等,為資料壓縮、通訊編碼等領域奠定基礎。
意圖分類是自然語言處理中的一項任務,旨在將一段文字(例如使用者查詢)分類到預定義的意圖類別中,以理解使用者的目的。
標註者一致性衡量多位標註者在相同資料上標註結果的相似程度。高一致性代表標註品質良好,反之則可能需要重新評估標註規範。
設計和使用易於人類理解決策過程的機器學習模型,透過明確的特徵-預測映射提高透明性與信任度。
入侵偵測系統(IDS)是一種安全系統,旨在監控網路或系統中的惡意活動或策略違規行為。它通過分析流量、日誌和系統行為來識別潛在的入侵。
學習率排程是一種在訓練過程中調整學習率的技術,旨在加速收斂、避免震盪,並提高模型的泛化能力。常見方法包括步階衰減、指數衰減和餘弦退火。
系統透過經驗不斷改進自身的學習過程,達到越來越高效的適應和泛化能力。
詞形還原是自然語言處理中將單詞還原為其基本形式(詞元)的過程,考慮了單詞的語法和上下文。
機器學習系統在整個生命週期內不斷學習新知識、新任務,同時保留和擴展既有知識。
線性迴歸法是一種統計方法,用於建立自變數和應變數之間的線性關係模型。目標是找到最佳擬合線,以預測應變數的值。
LLaMA(Large Language Model Meta AI)是 Meta 開發的開放權重(open-weight)大型語言模型系列,可免費下載、修改、自行部署,採 Meta 自訂 community license 授權,非 OSI 認證開源。
對數損失(Log Loss)是交叉熵損失在二元分類問題中的特殊形式,衡量模型預測機率與真實標籤之間的差異,數值越小代表模型表現越好。
邏輯程式設計是一種基於形式邏輯的程式典範,透過宣告事實與規則來推導結論,而非明確指令執行步驟。
邏輯式人工智慧利用形式邏輯表示知識並進行推論,旨在模擬人類的符號推理過程,解決複雜問題,強調可解釋性。
邏輯迴歸是一種廣義線性模型,用於預測二元或多元分類結果的機率。它使用 Sigmoid 函數將線性組合轉換為機率值,並透過最大似然估計來訓練模型。
指大型語言模型能夠處理和理解更長输入序列的能力,通常指支援數千到數百萬個 token 的上下文窗口。
損失函數衡量模型預測與實際值之間的差異,數值越小代表模型預測越準確,是模型訓練中優化目標的關鍵組成部分。
機器學習讓電腦透過分析大量資料自動找出規律,無需明確程式指令即可完成預測與分類任務
版本控制系統中主要的開發線路,通常包含穩定且可發布的程式碼。
Mamba是一種基於選擇機制的序列模型,旨在解決Transformer在長序列建模上的效率瓶頸,透過硬體感知演算法提升運算速度。
馬可夫決策過程(MDP)是一種用於建模決策的數學框架,其中結果部分隨機,部分受決策者控制。它廣泛應用於強化學習。
遮蔽語言模型(MLM)是一種自監督學習方法,隨機遮蔽輸入文本的部分詞語,並訓練模型預測這些被遮蔽的詞語。
機制性可解釋性旨在理解AI模型內部運作的具體機制,如同理解程式碼般,而非僅僅觀察輸入輸出關係。
梅爾頻譜圖是一種音訊訊號的視覺表示,它將音訊的頻率轉換到梅爾尺度上,更符合人類聽覺感知,常用於語音辨識和音訊分析。
具有外部記憶機制的神經網路架構,能夠存儲、檢索和更新信息,支持推理任務。
一種統一的圖神經網路框架,將圖學習過程表述為節點間的消息生成、傳遞和聚合。
元學習,又稱學習如何學習,旨在訓練模型能夠快速適應新任務或環境,透過少量樣本即可達到良好的效能。
深度混合是一種模型架構,它結合了多個不同深度的子網路,以提升模型的表達能力和泛化能力,並允許模型根據輸入動態調整其深度。
透過機器學習演算法在大量數據中學習規律與特徵後,所產生可用於預測、分類或生成的數學結構與參數集合。
一種元學習方法,訓練模型使其對新任務能透過少量樣本迅速適應,與模型架構無關。
模型壓縮是指減少機器學習模型大小和計算複雜度的技術,以便在資源有限的設備上部署,同時保持模型性能。
模型參數是機器學習模型從資料中學習到的內部數值變數,包含權重與偏差,主要決定模型如何產生預測結果。
蒙地卡羅方法是一種利用隨機抽樣來估算數學問題解的計算技術。它通過大量模擬隨機事件,統計結果,從而得到近似解。
運動規劃是計算機科學和機器人學中的一個領域,旨在為機器人或其他代理找到從起點到終點的可行路徑,同時避開障礙物並滿足特定約束。
Multi 泛指人工智慧中結合多種資料類型、任務或智能體的技術,能大幅提升系統處理複雜現實問題的靈活性。
多個智能體在同一環境中互動的強化學習,須處理協作、競爭和通訊等複雜關係。
多任務學習是一種機器學習方法,旨在同時訓練一個模型來執行多個相關任務,以提升模型的泛化能力和效率。
N元語法是一種自然語言處理技術,用於預測序列中下一個詞的概率,基於前N-1個詞的出現頻率。
樸素貝氏分類器是一種基於貝氏定理的簡單機率分類器。它假設所有特徵之間相互獨立,簡化了計算複雜度,因此得名「樸素」。常用於文本分類等任務。
自然語言推論是判斷前提句子是否能邏輯推導出假設句子的技術,協助機器理解語言的深層語意關係。
巢狀欄位是一種資料結構,指一個欄位內部包含其他子欄位,形成階層關係,常用於表示複雜或半結構化資料,提升資料組織與查詢效率。
神經架構搜尋(NAS)是一種自動化設計神經網路架構的技術,旨在尋找在特定任務上表現最佳的模型結構,無需人工手動設計。
神經形態運算是一種模擬生物大腦結構的硬體架構,旨在以極低的功耗執行複雜的機器學習與人工智慧運算任務。
根據累積機率選擇詞彙範圍,只從機率累計達到設定閾值(如 90%)的最少詞彙中採樣,比 Top-k 更能適應不同機率分布。
單樣本學習是一種機器學習方法,旨在僅使用一個或少數幾個樣本來學習新的類別或概念,模擬人類快速學習的能力。
線上學習是一種機器學習方法,模型在接收到每個新資料點後立即更新,無需儲存所有資料或進行批次訓練,適用於資料流場景。
本體論是明確指定領域概念及其關係的正式表示,用於知識共享和推理,是知識圖譜的基礎。
選項框架是層次化強化學習中的數學模型,透過將基礎動作抽象為高階宏觀動作,幫助智能體在複雜環境中進行長時間跨度的規劃與決策。
流程協調是指自動化安排、協調和管理複雜的計算機系統、應用程式和服務的過程,以實現特定目標。
神經網路最後一層,根據任務類型選擇合適的激活函數,將隱藏層的高維特徵轉換為最終預測結果(分類概率、迴歸值或其他形式),是模型與外界交互的界面。
全景品質是評估全景分割同時辨識物件與分割區域是否正確的綜合指標。
詞性標注是自然語言處理中,為句子中的每個詞彙指定詞性的過程,例如名詞、動詞、形容詞等,是後續語法分析的基礎。
感知器是最簡單的神經網路模型,模擬生物神經元,接收輸入、加權求和、通過激活函數輸出,用於二元分類。
在人工智慧中,規劃是指為達成特定目標,自動生成一系列行動步驟的過程。它涉及預測行動的結果,並選擇最佳的行動序列。
位置編碼是一種將序列中單詞或符號的位置資訊嵌入到向量表示中的技術,使模型能感知序列順序。
精確率是模型預測為正例中真正為正例的比例,反映預測結果的準確度,與召回率形成取捨
二分類評估工具,縱軸為精確率,橫軸為召回率,展示模型在不同決策閾值下精確率和召回率的權衡關係,特別適合評估類別不均衡問題
機率分佈描述了隨機變數所有可能取值及其對應的機率。它可以是離散的(例如二項分佈)或連續的(例如常態分佈)。
推理能力是指AI系統基於已知資訊和規則,進行邏輯推導,得出結論或解決問題的能力。是AI模擬人類智慧的關鍵組成部分。
強化學習是一種讓 AI 透過與環境互動,從獎勵和懲罰中學習,進而找到最佳行動策略的方法
在生成過程中對已經出現的詞彙施加機率懲罰,抑制模型重複使用相同詞彙或短語,提高文本多樣性。
ResNet是一種深度學習模型,透過引入殘差連接解決深度神經網路訓練時的梯度消失問題,允許網路學習殘差映射而非直接映射。
負責任AI是一種全面性的框架,旨在確保人工智慧系統的開發、部署與使用過程,能嚴格遵守倫理原則、社會價值觀和法律規範,以促進公平、透明且可信賴的AI發展。
從大規模資料庫中快速且精準地找出與使用者查詢高度相關的資訊或文件的核心技術。
獎勵函數是強化學習中定義代理在特定狀態下採取特定動作後獲得的獎勵的函數,用於引導代理學習期望行為。
一種在強化學習系統中出現的現象,指智能體發現並利用獎勵函數的漏洞或意外行為來獲得高分,而不是實現設計者的實際目標。這種遺漏通常源於獎勵函數與真實目標之間的不完全對齐。
環狀注意力是一種分散式注意力機制,將注意力計算分散到多個設備上,減少單一設備的記憶體需求,適用於超大型模型。
機器人理財顧問是一種使用演算法和人工智慧來提供自動化投資建議和管理服務的平台,旨在降低投資門檻和成本。
RPA(機器人流程自動化)用軟體機器人模擬人類操作電腦,自動執行重複性業務流程,廣泛應用於金融對帳、訂單處理、HR 入職等高量重複性作業。
接收者操作特徵曲線(Receiver Operating Characteristic Curve)是以偽陽性率為橫軸、真陽性率為縱軸,透過改變分類閾值所繪製的曲線,用於評估二元分類模型在不同閾值下的
ROUGE評分是一種用於評估自動文本摘要或機器翻譯品質的指標,通過比較生成文本與參考文本的n-gram重疊程度來衡量。
函數曲面上在某方向為局部最大值,在另一方向為局部最小值之點,形似馬鞍。在最佳化中,理解收斂行為的關鍵概念。
規模指AI系統中模型參數、訓練資料與運算資源的量級。擴展規模可顯著提升效能,是推動大型語言模型突破的關鍵因素。
規模定律描述了模型性能如何隨著模型大小、訓練數據量和計算資源的增加而變化。它提供了一種預測模型性能的經驗關係。
識別並映射不同資料源之間語義等效的資料元素,以實現資料整合與互通。
綱要演進是指資料庫或資料倉儲的綱要隨著時間推移而發生的變更,以及管理這些變更的過程,以確保資料的相容性和可用性。
季節性分解是一種時序分析技術,將時間序列分解為趨勢、季節性、週期性和殘差等成分,以便更好地理解和預測資料。
自我對弈是一種強化學習技術,其中智能體與自身的副本進行對弈,從而學習和改進策略,無需外部人類或標記數據。
語義分析旨在理解文本的真實含義,超越字面解釋,提取句子或段落的深層語義結構和關係,賦予機器理解語言的能力。
半監督學習是一種機器學習方法,它結合了少量標記資料和大量未標記資料進行模型訓練,旨在利用未標記資料提升模型效能,降低標記成本。
一種廣泛使用的密碼學雜湊函數,將任意長度資料轉換為固定256位元雜湊值。
直接連接網路中相隔若干層的神經元,允許梯度和信息跳過中間層流通,改善深層網路的梯度流動和訓練穩定性。
SPARQL是一種用於查詢和操作RDF資料的查詢語言,類似於SQL用於關係資料庫。它允許使用者從知識圖譜中提取特定資訊。
稀疏檢索是一種資訊檢索方法,它使用稀疏向量來表示查詢和文檔,向量中的非零元素通常表示詞彙的存在或重要性。
推測解碼是一種加速大型語言模型推論速度的技術,透過小型模型預測多個token,再由大型模型驗證,減少計算量。
脈衝神經網路屬於第三代人工神經網路,模仿生物大腦透過離散的脈衝訊號進行資訊傳遞,具備極低的功耗與高時間解析度優勢。
狀態機模型是一種計算模型,系統在任何給定時間都處於有限數量的狀態之一,並根據輸入在狀態之間轉換。
詞幹提取是自然語言處理中將單詞簡化為其詞幹或詞根形式的過程,通常通過刪除後綴來實現。
結構化資料是指具有預定義格式和組織方式的資料,易於儲存、查詢和分析,例如關聯式資料庫中的表格。
超級對齊旨在確保遠超人類智慧的AI系統,其目標與人類價值觀對齊,避免潛在的失控風險。
監督式學習是一種 AI 方法,透過提供帶有正確標籤的輸入資料,訓練模型學習預測新資料的標籤
符號推理是人工智慧中一種透過符號表示知識,並運用邏輯規則進行推論的方法,旨在模擬人類的理性思考過程。
系統提示詞是用於引導大型語言模型行為的初始指令,影響模型的回應風格、知識範圍和任務執行方式。
T5 (Text-to-Text Transfer Transformer) 是一種將所有 NLP 任務轉換為文本到文本格式的轉換器模型,簡化了模型訓練和應用。
透過調整溫度參數,控制語言模型生成文本的隨機程度和多樣性。溫度越低生成越確定,溫度越高生成越隨機。
時間抽象化將一連串底層動作封裝為高階技能,使強化學習模型能在更長的時間尺度上決策與規劃。
時序差分學習是一種強化學習方法,透過預測未來獎勵並更新預測值,從不完整的序列中學習,無需等待完整結果。
文字轉語音 (TTS) 技術將文字轉換為人類可理解的語音。它廣泛應用於輔助工具、語音助手和內容創作等領域。
文本蘊含是判斷一段前提文本是否能邏輯推導出另一段假設文本的自然語言處理任務,廣泛應用於問答系統與事實查核。
時間序列分析是研究按時間順序排列的數據點序列,以識別模式、趨勢和週期性,並預測未來值。
符記是大型語言模型處理文字時,不可分割的最小單位,它可以是一個字、詞,或者更小的子詞
工具使用能力是指大型語言模型利用外部工具(例如API、資料庫)來擴展其功能,完成更複雜任務的能力。
限制每次詞彙選擇只從機率最高的 k 個候選詞彙中進行隨機採樣,減少低機率詞彙被錯誤選中的風險。
張量處理單元(TPU)是Google專為加速機器學習工作負載而設計的客製化硬體加速器,尤其擅長處理張量運算,是深度學習的利器。
訓練集是用於訓練機器學習模型的資料集,模型通過學習訓練集中的模式和關係來提升預測能力。
AutoML遷移學習利用預訓練模型知識,加速AutoML流程,減少訓練數據需求,提升模型泛化能力,並降低計算成本。