術語詞典

大型語言模型相關 AI 術語

瀏覽 AITerms.tw 中標籤為「大型語言模型」的 AI 術語，快速找到定義、FAQ 與 iPAS 考試重點。

目前篩選：標籤「大型語言模型」，共 144 個術語。

目前篩選：標籤「大型語言模型」，共 144 個術語

清除篩選同一術語可隸屬多個主題，因此主題數量會重複計算。

共找到 144 個術語標籤：大型語言模型清除條件

A

8 個術語

摘要生成技術 Abstractive Summarization

摘要生成技術利用AI理解原文，並以新的句子和詞彙生成摘要，更接近人類的摘要方式，但實現難度較高。

自然語言處理深度學習生成式AI

摘要生成技術是什麼？→

適配器模組 Adapter

適配器模組是一種輕量級的模型微調方法，透過在預訓練模型中插入少量可訓練參數，以適應特定任務，同時保持原始模型參數凍結。

機器學習深度學習自然語言處理

適配器模組是什麼？→

AI代理 Agent

具備自主感知環境、做出決策並執行相應動作以達成特定目標的智慧型軟體實體。

AI應用生成式AI大型語言模型

AI代理是什麼？→

注意力線性偏置 ALiBi

一種相對位置編碼方法，通過在注意力分數中添加位置相關的線性偏置項，實現相對位置編碼且具有優秀的外推性能。

大型語言模型深度學習神經網路

注意力線性偏置是什麼？→

對齊校準 Alignment

對齊校準是指使AI模型，特別是大型語言模型，的行為與人類意圖、價值觀和倫理規範相符的過程，降低潛在風險。

大型語言模型生成式AI模型訓練

對齊校準是什麼？→

對齊稅 Alignment Tax

模型在對齊（使其行為符合人類價值觀）過程中可能損失的性能，特別是在某些原始能力上的下降。

大型語言模型AI倫理與治理AI基礎

對齊稅是什麼？→

全規約演算法 All-Reduce

iPAS

一種在分散式系統中進行資料聚合與同步的通訊操作，確保所有計算節點最終獲得完全相同的整合結果。

模型訓練深度學習大型語言模型

全規約演算法是什麼？→

注意力崩潰 Attention Collapse

iPAS

注意力崩潰指深度神經網路的注意力權重趨向一致，導致模型無法有效區分輸入特徵的現象。

深度學習模型訓練神經網路

注意力崩潰是什麼？→

B

8 個術語

集束搜尋 Beam Search

集束搜尋是一種啟發式搜尋演算法，用於序列預測任務，它在每個時間步保留多個最有可能的候選序列（集束），而非僅僅選擇最佳選項。

自然語言處理生成式AI模型訓練

集束搜尋是什麼？→

模型基準測試 Bench

模型基準測試是一套標準化的評估任務與資料集，用來客觀衡量並比較不同 AI 模型的各項性能與實際能力。

模型評估大型語言模型AI基礎

模型基準測試是什麼？→

雙向編碼器表示 BERT

BERT是一種基於Transformer架構的雙向編碼器模型，用於理解文本的語義和上下文，廣泛應用於自然語言理解任務。

大型語言模型自然語言處理深度學習

雙向編碼器表示是什麼？→

雙向語境 Bidirectional Context

iPAS

雙向語境是同時參考目標元素前後文資訊的技術，能大幅提升模型對整體脈絡與語意的理解精準度。

自然語言處理神經網路大型語言模型

雙向語境是什麼？→

雙向編碼器 Bidirectional Encoder

能同時處理序列的前向和後向上下文，在每個位置都能看到完整序列信息的神經網路編碼器，相比單向模型提供更豐富的上下文表示，是 BERT 等預訓練模型的核心。

深度學習自然語言處理大型語言模型

雙向編碼器是什麼？→

BERT Bidirectional Encoder Representations from Transformers

iPAS

Google 的雙向語言模型，用 MLM（遮罩）和 NSP 預訓練，擅長理解文本語意

自然語言處理深度學習大型語言模型

BERT 是什麼？→

雙語評估替代指標 Bilingual Evaluation Understudy

雙語評估替代指標（BLEU，Bilingual Evaluation Understudy）是機器翻譯品質評估的自動化量化指標，透過比對機器翻譯輸出與人工參考譯文中 n-gram 的重疊程度，給出 0

自然語言處理模型評估大型語言模型

雙語評估替代指標是什麼？→

位元組對編碼 Byte Pair Encoding

位元組對編碼（BPE）是一種資料壓縮技術，也常用於自然語言處理中，作為一種詞彙標記化方法，將單詞分解成更小的子詞單元。

自然語言處理資料處理模型訓練

位元組對編碼是什麼？→

C

18 個術語

因果語言模型 Causal Language Model

因果語言模型是一種語言模型，它基於序列中先前詞彙預測下一個詞彙，並明確建模詞彙之間的因果關係，以提升生成文本的連貫性和可控性。

自然語言處理生成式AI模型訓練

因果語言模型是什麼？→

思維鏈 Chain-of-Thought

思維鏈是一種讓大型語言模型逐步推理，而非直接給出答案，以提升複雜問題解答正確率的方法

大型語言模型Prompt工程自然語言處理

思維鏈是什麼？→

思維鏈提示 Chain-of-Thought Prompting

思維鏈提示是一種Prompt工程技術，透過引導模型逐步推理，提升複雜問題的解答品質與可解釋性。

Prompt工程大型語言模型自然語言處理

思維鏈提示是什麼？→

聊天機器人 Chatbot

聊天機器人是一種能模擬人類對話的電腦程式，透過文字或語音與使用者互動，提供資訊、協助解決問題或執行特定任務。

自然語言處理機器學習AI應用

聊天機器人是什麼？→

金吉拉縮放 Chinchilla Scaling

金吉拉縮放是一種模型縮放法則，旨在透過調整模型大小和訓練資料量，以達到最佳的計算效率，避免過度訓練或訓練不足。

機器學習深度學習大型語言模型

金吉拉縮放是什麼？→

分塊處理 Chunking

分塊處理是指將大型資料集或文本分割成更小、更易於管理的部分，以便於模型處理和分析，提升效率。

自然語言處理資料處理大型語言模型

分塊處理是什麼？→

無分類器引導 Classifier-free Guidance

一種條件生成技術，不依賴外部分類器，通過在無條件生成過程中注入條件信息來控制生成結果，常用於文本到圖像等多模態任務。

生成式AI深度學習大型語言模型

無分類器引導是什麼？→

完形填空任務 Cloze Task

完形填空任務是一種語言理解測試，透過移除文本中的部分詞彙，要求模型或人類填補缺失部分，以評估其對上下文的理解能力。

自然語言處理模型評估自監督學習

完形填空任務是什麼？→

程式碼生成 Code Generation

程式碼生成是指利用人工智慧模型，自動產生程式碼片段或完整程式的技術，旨在提高開發效率並降低編碼錯誤。

生成式AI大型語言模型自然語言處理

程式碼生成是什麼？→

常識推理 Commonsense Reasoning

常識推理是賦予人工智慧運用人類日常生活基礎知識進行邏輯判斷的能力，使其能對未明言情境做出合理推斷。

自然語言處理AI基礎知識圖譜

常識推理是什麼？→

憲法型 AI Constitutional AI

一種對齐大型語言模型的方法，透過編制一份「憲法」（一組原則和價值準則），指導 AI 系統自我批評和改進行為，無需依賴大量人類反饋，實現更可控且價值對齐的 AI 系統。

AI倫理與治理大型語言模型AI基礎

憲法型 AI 是什麼？→

憲法式AI原則 Constitutional AI Principles

憲法式AI原則是一種透過明確的價值觀或「憲法」來引導AI系統行為的方法，旨在確保AI的輸出符合人類的期望和倫理標準。

AI倫理與治理大型語言模型模型訓練

憲法式AI原則是什麼？→

上下文脈絡 Context

AI 模型在生成回應或進行預測時，所能參考與記憶的輸入資訊範圍及歷史對話內容。

自然語言處理大型語言模型生成式AI

上下文脈絡是什麼？→

上下文窗口 Context Window

上下文窗口是指，大型語言模型一次性能處理的最大 Token 數量，超過此限制模型便會遺忘先前的內容

自然語言處理大型語言模型

上下文窗口是什麼？→

上下文窗口管理 Context Window Management

有效利用 LLM 的上下文窗口（模型能處理的最大序列長度），在有限的空間內優先放置最重要的信息，避免超長內容丟失或品質下降。

大型語言模型AI基礎Prompt工程

上下文窗口管理是什麼？→

對話式人工智慧 Conversational AI

對話式人工智慧是指能透過自然語言與人類進行互動的AI系統，例如聊天機器人或語音助理，旨在提供更自然、直觀的互動體驗。

自然語言處理機器學習深度學習

對話式人工智慧是什麼？→

程式碼副駕駛 Copilot

Copilot 是一個 AI 程式碼助手，透過分析程式碼上下文，提供程式碼建議、自動完成和程式碼生成，提升開發效率。

生成式AI大型語言模型自然語言處理

程式碼副駕駛是什麼？→

語料庫 Corpus

語料庫是大量結構化的文本集合，用於語言研究和自然語言處理，提供真實語言使用的範例，用於訓練和評估模型。

自然語言處理資料處理AI基礎

語料庫是什麼？→

D

8 個術語

資料分片 Data Sharding

iPAS

將大規模資料集水平切割為多個獨立區塊，以提升平行處理效率與降低記憶體負荷。

資料處理模型訓練MLOps

資料分片是什麼？→

解碼器唯一架構 Decoder-only Architecture

深度學習模型架構設計，僅使用解碼器（Decoder）層進行文本生成和處理，無需編碼器，通過因果遮蔽使模型只能關注當前位置的歷史信息，實現自迴歸文本生成。

深度學習自然語言處理大型語言模型

解碼器唯一架構是什麼？→

僅解碼器模型 Decoder-Only Model

iPAS

僅解碼器模型是一種專注於自迴歸生成的架構，透過預測下一個詞彙來產生連續文本，為現代語言模型的核心。

深度學習自然語言處理生成式AI

僅解碼器模型是什麼？→

稠密檢索模型 Dense Retrieval

稠密檢索模型使用神經網路將查詢和文檔嵌入到一個低維向量空間中，通過計算向量相似度來檢索相關文檔，克服了傳統方法的詞彙不匹配問題。

機器學習深度學習自然語言處理

稠密檢索模型是什麼？→

對話系統 Dialogue System

對話系統是一種能與人類進行自然語言互動的AI系統，目標是理解使用者意圖並提供適當的回應，完成特定任務或提供資訊。

自然語言處理AI應用機器學習

對話系統是什麼？→

直接偏好優化 Direct Preference Optimization

直接偏好優化（DPO）是一種直接利用人類偏好資料，優化語言模型，無需訓練獎勵模型的強化學習替代方案。

強化學習大型語言模型模型訓練

直接偏好優化是什麼？→

點積注意力 Dot Product Attention

Transformer 中最基礎的注意力機制，透過查詢向量與鍵向量的點積計算相似度，再用 softmax 轉為權重後對值向量加權求和。

Transformer注意力機制自注意力

點積注意力是什麼？→

動態批處理 Dynamic Batching

根據系統負載和數據可用性，動態調整批次大小和處理時機的推理最佳化技術，用於平衡吞吐量和延遲。

模型部署大型語言模型推理優化

動態批處理是什麼？→

E

1 個術語

湧現能力 Emergent Abilities

湧現能力是指大型語言模型在達到一定規模後，突然展現出在較小模型中未曾觀察到的複雜能力，例如推理、翻譯和程式碼生成。

機器學習深度學習大型語言模型

湧現能力是什麼？→

F

4 個術語

少樣本提示 Few-shot Prompting

在提示詞中提供少量（通常 2-10 個）輸入輸出範例，引導語言模型依照示範格式完成任務的提示技術。

Prompt工程情境學習大型語言模型

少樣本提示是什麼？→

閃電注意力機制 Flash Attention

閃電注意力機制是一種優化注意力計算的技術，透過重新排序計算步驟和利用硬體加速，大幅提升注意力計算的速度和記憶體效率。

機器學習深度學習自然語言處理

閃電注意力機制是什麼？→

基礎模型 Foundation Model

基礎模型是使用大量未標記數據訓練的大型模型，可適應多種下游任務，展現出強大的泛化能力和遷移學習能力。

機器學習深度學習自然語言處理

基礎模型是什麼？→

函數呼叫 Function Calling

函數呼叫是一種允許大型語言模型（LLM）調用外部函數或API的能力，以擴展其功能並與外部世界互動。

大型語言模型Prompt工程AI應用

函數呼叫是什麼？→

G

8 個術語

生成式模型 Generative Model

生成式模型（Generative Model）是能夠學習資料的機率分布並從中生成新樣本的機器學習模型，涵蓋 GAN、VAE、擴散模型等架構，廣泛應用於影像合成、文字生成與資料擴增。

生成式AI深度學習大型語言模型

生成式模型是什麼？→

生成式預訓練轉換器 Generative Pre-trained Transformer

iPAS

OpenAI 的自回歸語言模型，一個字接一個字生成文本，只使用 Decoder 架構

大型語言模型自然語言處理深度學習

生成式預訓練轉換器是什麼？→

生成式預訓練模型 GPT

GPT是一種基於Transformer架構的大型語言模型，透過預訓練學習大量文本資料，用於生成文本、翻譯語言、回答問題等。

大型語言模型生成式AI自然語言處理

生成式預訓練模型是什麼？→

GRACE（圖神經網路知識編輯方法） GRACE

利用離散神經記憶碼本對知識編輯目標局部化的大型語言模型知識修正框架。

知識編輯大型語言模型神經記憶

GRACE（圖神經網路知識編輯方法）是什麼？→

圖檢索增強 Graph RAG

圖檢索增強（Graph RAG）利用知識圖譜結構化信息，提升檢索效率和答案準確性，優於傳統向量檢索。

自然語言處理知識圖譜大型語言模型

圖檢索增強是什麼？→

貪婪解碼 Greedy Decoding

貪婪解碼是一種序列生成方法，在每個時間步選擇概率最高的詞作為輸出，直到生成終止符號或達到最大長度。它簡單快速，但可能陷入局部最佳解。

自然語言處理生成式AI模型訓練

貪婪解碼是什麼？→

分組查詢注意力 Grouped Query Attention

一種高效的注意力機制，將多個查詢頭共享同一組鍵值頭，減少模型參數和記憶體消耗，同時保持性能不下降。

大型語言模型深度學習神經網路

分組查詢注意力是什麼？→

安全護欄 Guardrails

AI安全護欄是用於限制AI系統行為，確保其符合預期規範和倫理標準的機制，防止產生有害或不當的輸出。

AI倫理與治理大型語言模型Prompt工程

安全護欄是什麼？→

H

3 個術語

AI 幻覺 Hallucination

iPAS

AI 幻覺是大型語言模型產生自信但事實錯誤或無中生有內容的現象，是 LLM 部署的主要風險

大型語言模型自然語言處理AI倫理與治理

AI 幻覺是什麼？→

混合搜尋 Hybrid Search

混合搜尋結合了多種搜尋技術，例如關鍵字搜尋和語義搜尋，以提高搜尋結果的相關性和準確性，提供更全面的資訊。

自然語言處理推薦系統AI應用

混合搜尋是什麼？→

假設性文件嵌入 Hypothetical Document Embeddings

iPAS

假設性文件嵌入是一種檢索技術，透過語言模型先生成假設解答，再將該解答轉為向量以搜尋真實文件。

自然語言處理大型語言模型生成式AI

假設性文件嵌入是什麼？→

I

3 個術語

上下文學習 In-context Learning

上下文學習 (In-context Learning) 指的是大型語言模型無需額外訓練，僅通過輸入範例即可學習新任務的能力。

大型語言模型自然語言處理機器學習

上下文學習是什麼？→

上下文學習理論 In-context Learning Theory

上下文學習理論指大型語言模型無需額外訓練，僅憑藉輸入提示中的範例，即可執行新任務的能力，展現了模型泛化的潛力。

大型語言模型Prompt工程模型訓練

上下文學習理論是什麼？→

指令微調 Instruction Tuning

指令微調是一種利用特定格式指令資料集，微調預訓練語言模型，使其更精確理解並執行人類指令的技術。

大型語言模型模型訓練自然語言處理

指令微調是什麼？→

J

1 個術語

越獄攻擊 Jailbreaking

一種對大型語言模型或其他 AI 系統的攻擊方法，通過巧妙地設計輸入提示詞或利用模型的漏洞，繞過系統的安全防護和內容政策限制，使模型生成原本應該被阻止的內容，如有害建議、違法信息或有成見的輸出。

AI倫理與治理大型語言模型Prompt工程

越獄攻擊是什麼？→

K

2 個術語

知識圖譜 Knowledge Graph

知識圖譜（Knowledge Graph）是以圖結構儲存實體（Entity）及其關係（Relation）的語意知識庫，透過「主體—關係—客體」三元組表示現實世界的知識，廣泛應用於搜尋引擎增強、問答系統

知識圖譜自然語言處理大型語言模型

知識圖譜是什麼？→

鍵值緩存 KV Cache

在大型語言模型推理中，預先計算並存儲前面 token 的鍵和值向量，避免重複計算的優化技術。

模型部署大型語言模型推理優化

鍵值緩存是什麼？→

L

11 個術語

LangChain框架 LangChain

LangChain是一個用於開發基於大型語言模型（LLM）應用程式的框架。它簡化了LLM的整合、鏈接和部署，讓開發者能快速構建複雜的AI應用。

大型語言模型自然語言處理AI應用

LangChain框架是什麼？→

語言處理與模型 Language

在AI中，「語言」專指機器對人類自然語言的理解與生成能力，是實現人機順暢溝通與通用人工智慧的關鍵技術橋樑。

大型語言模型自然語言處理生成式AI

語言處理與模型是什麼？→

羊駝語言模型 LLaMA

LLaMA（Large Language Model Meta AI）是 Meta 開發的開放權重（open-weight）大型語言模型系列，可免費下載、修改、自行部署，採 Meta 自訂 community license 授權，非 OSI 認證開源。

自然語言處理深度學習模型訓練

羊駝語言模型是什麼？→

羊駝索引 LlamaIndex

LlamaIndex是一個資料框架，用於連接大型語言模型（LLMs）與您的私有或特定領域的資料，簡化建立基於LLM的應用程式。

大型語言模型資料處理自然語言處理

羊駝索引是什麼？→

大型語言模型代理 LLM Agents

以大型語言模型為核心決策引擎，結合工具調用與記憶機制，自主規劃並執行多步驟任務的 AI 系統。

大型語言模型AI代理工具調用

大型語言模型代理是什麼？→

大型語言模型群 LLMs

LLMs 是大型語言模型群的統稱，代表當今具備強大自然語言理解與生成能力的各類基礎模型集合。

大型語言模型生成式AIAI應用

大型語言模型群是什麼？→

邏輯形式生成 Logical Form Generation

邏輯形式生成是將自然語言轉換為結構化、機器可讀且無歧義表達式的過程，為語意分析的核心。

自然語言處理知識圖譜大型語言模型

邏輯形式生成是什麼？→

長序列與長尾分佈 Long

指時序資料裡跨度極大的長程關聯性，或資料集中呈現數量極少但種類繁多的極端不平衡長尾樣本分佈現象。

自然語言處理大型語言模型時序分析

長序列與長尾分佈是什麼？→

長上下文 Long Context

指大型語言模型能夠處理和理解更長输入序列的能力，通常指支援數千到數百萬個 token 的上下文窗口。

大型語言模型深度學習神經網路

長上下文是什麼？→

低秩適配 LoRA

LoRA是一種參數高效的微調技術，透過學習低秩矩陣來適應預訓練模型，大幅減少訓練參數，降低計算成本。

機器學習深度學習自然語言處理

低秩適配是什麼？→

低秩適應 Low-Rank Adaptation

透過在預訓練模型的權重矩陣旁插入低秩分解矩陣來進行參數高效微調的技術。

微調參數高效微調大型語言模型

低秩適應是什麼？→

M

7 個術語

曼巴模型 Mamba

Mamba是一種基於選擇機制的序列模型，旨在解決Transformer在長序列建模上的效率瓶頸，透過硬體感知演算法提升運算速度。

深度學習自然語言處理模型訓練

曼巴模型是什麼？→

遮蔽語言模型 Masked Language Model

遮蔽語言模型（MLM）是一種自監督學習方法，隨機遮蔽輸入文本的部分詞語，並訓練模型預測這些被遮蔽的詞語。

深度學習自然語言處理自監督學習

遮蔽語言模型是什麼？→

機制性可解釋性 Mechanistic Interpretability

機制性可解釋性旨在理解AI模型內部運作的具體機制，如同理解程式碼般，而非僅僅觀察輸入輸出關係。

機器學習深度學習神經網路

機制性可解釋性是什麼？→

記憶率 Memorization Rate

iPAS

記憶率衡量AI模型對訓練資料中特定樣本的過度記憶程度，可能導致隱私洩露或泛化能力差。

模型訓練模型評估AI倫理與治理

記憶率是什麼？→

專家混合模型 Mixture of Experts

專家混合模型是一種機器學習技術，透過結合多個獨立的「專家」模型，針對不同輸入選擇性地激活特定專家，以提升模型整體效能。

機器學習深度學習自然語言處理

專家混合模型是什麼？→

模型平行化 Model Parallelism

模型平行化是一種將大型模型分割到多個裝置上進行訓練或推論的技術，以克服單一裝置的記憶體限制。

深度學習模型訓練模型部署

模型平行化是什麼？→

多跳推理 Multi-hop Reasoning

多跳推理是指需要通過多個推理步驟才能得出結論的推理過程，模擬人類複雜的思考方式。

自然語言處理知識圖譜AI應用

多跳推理是什麼？→

N

4 個術語

N元語法 N-gram

N元語法是一種自然語言處理技術，用於預測序列中下一個詞的概率，基於前N-1個詞的出現頻率。

自然語言處理統計方法AI基礎

N元語法是什麼？→

自然語言生成 Natural Language Generation

自然語言生成（NLG）是將結構化資料轉換為人類可理解的自然語言文本的AI技術，廣泛應用於報告生成、聊天機器人等。

自然語言處理生成式AIAI應用

自然語言生成是什麼？→

自然語言理解 Natural Language Understanding

自然語言理解（NLU）是人工智慧的一個分支，旨在使電腦能夠理解和解釋人類語言的含義，從而執行相關任務。

自然語言處理機器學習深度學習

自然語言理解是什麼？→

核心採樣 Nucleus Sampling

根據累積機率選擇詞彙範圍，只從機率累計達到設定閾值（如 90%）的最少詞彙中採樣，比 Top-k 更能適應不同機率分布。

大型語言模型生成式AIPrompt工程

核心採樣是什麼？→

O

1 個術語

最佳化器狀態 Optimizer State

iPAS

指機器學習訓練過程中，最佳化演算法為更新模型權重所儲存的動量、變異數等歷史計算數值。

模型訓練最佳化深度學習

最佳化器狀態是什麼？→

P

8 個術語

路徑語言模型 PaLM

PaLM (Pathways Language Model) 是 Google 開發的大型語言模型，以其卓越的推理能力和多語言處理能力著稱。

大型語言模型自然語言處理深度學習

路徑語言模型是什麼？→

困惑度 Perplexity

困惑度衡量語言模型預測文本序列的能力，數值越低代表模型預測能力越好，對文本的理解程度越高。

自然語言處理模型評估大型語言模型

困惑度是什麼？→

流水線並行 Pipeline Parallelism

將深度神經網路的不同層分配到不同的 GPU 設備上，讓多個 micro-batch 在不同層上交叉執行以提高 GPU 利用率的分佈式訓練方法。

模型訓練分佈式訓練深度學習

流水線並行是什麼？→

策略崩潰 Policy Collapse

iPAS

策略崩潰是強化學習中因參數更新過度，導致行為迅速退化成單一無效模式的現象，嚴重破壞訓練穩定性。

強化學習大型語言模型模型訓練

策略崩潰是什麼？→

前綴調整法 Prefix Tuning

前綴調整法是一種參數高效的微調技術，通過在輸入序列前添加可訓練的前綴向量，來引導預訓練模型生成期望的輸出，同時保持原始模型參數凍結。

機器學習深度學習自然語言處理

前綴調整法是什麼？→

提示工程 Prompt Engineering

iPAS

提示工程是設計與優化輸入給 AI 模型的指令，以引導模型產生更準確、符合需求的回應

大型語言模型自然語言處理生成式AI 高頻

提示工程是什麼？→

提示詞注入 Prompt Injection

提示詞注入是一種安全漏洞，攻擊者通過惡意設計的提示詞操控大型語言模型的行為，使其忽略或違反原始指令。

大型語言模型Prompt工程AI倫理與治理

提示詞注入是什麼？→

偽平行語料庫 Pseudo-Parallel Corpus

iPAS

透過自動化演算法從多語言文本中萃取或合成的高語義相似度句子對集合，主要用於緩解跨語言任務中的資料稀缺問題。

自然語言處理資料處理模型訓練

偽平行語料庫是什麼？→

Q

2 個術語

量化低秩適配 QLoRA

QLoRA是LoRA的改進版，使用4位量化技術壓縮預訓練模型，進一步降低記憶體需求，實現在消費級硬體上微調大型模型。

機器學習深度學習自然語言處理

量化低秩適配是什麼？→

查詢重寫 Query Rewriting

iPAS

查詢重寫是將使用者原始輸入轉換為更精確檢索字串的技術，能解決詞彙不匹配問題，提升搜尋結果準確度。

自然語言處理大型語言模型Prompt工程

查詢重寫是什麼？→

R

13 個術語

ReAct框架 ReAct Framework

ReAct框架是一種結合推理（Reasoning）和行動（Acting）的AI Agent框架，允許模型在解決問題的過程中進行思考、規劃和執行。

AI Agent大型語言模型Prompt工程

ReAct框架是什麼？→

推理型閱讀理解 Reading Comprehension with Reasoning

要求模型跨越字面意義，透過邏輯推演與跨段落分析，推導出未明示結論的進階自然語言處理技術。

自然語言處理大型語言模型機器學習

推理型閱讀理解是什麼？→

倒數排名融合 Reciprocal Rank Fusion

iPAS

倒數排名融合是一種無需依賴絕對分數的結果融合技術。它透過計算文件在多個獨立檢索系統中排名的倒數並進行加總，藉此產生綜合多方結果的最終排名。

自然語言處理大型語言模型推薦系統

倒數排名融合是什麼？→

重複懲罰 Repetition Penalty

在生成過程中對已經出現的詞彙施加機率懲罰，抑制模型重複使用相同詞彙或短語，提高文本多樣性。

大型語言模型生成式AIPrompt工程

重複懲罰是什麼？→

資訊檢索 Retrieval

從大規模資料庫中快速且精準地找出與使用者查詢高度相關的資訊或文件的核心技術。

自然語言處理生成式AI大型語言模型

資訊檢索是什麼？→

檢索增強微調 Retrieval-Augmented Fine-tuning

檢索增強微調結合了檢索式和生成式模型的優勢，透過檢索相關資訊來增強微調過程，提升模型在特定任務上的效能。

自然語言處理模型訓練遷移學習

檢索增強微調是什麼？→

檢索增強生成 Retrieval-Augmented Generation

iPAS

RAG（檢索增強生成）讓 AI 回答問題前先查詢外部知識庫，再結合查到的資料生成答案，大幅減少幻覺、提升回答準確性。

生成式AI自然語言處理大型語言模型高頻

檢索增強生成是什麼？→

獎勵駭客攻擊 Reward Hacking

一種在強化學習系統中出現的現象，指智能體發現並利用獎勵函數的漏洞或意外行為來獲得高分，而不是實現設計者的實際目標。這種遺漏通常源於獎勵函數與真實目標之間的不完全對齐。

AI倫理與治理機器學習大型語言模型

獎勵駭客攻擊是什麼？→

獎勵建模 Reward Modeling

獎勵建模是訓練AI模型以預測人類對不同結果的偏好，用於強化學習中，引導模型學習符合人類價值的行為。

強化學習模型訓練AI倫理與治理

獎勵建模是什麼？→

環狀注意力 Ring Attention

環狀注意力是一種分散式注意力機制，將注意力計算分散到多個設備上，減少單一設備的記憶體需求，適用於超大型模型。

大型語言模型模型訓練模型部署

環狀注意力是什麼？→

自然語言處理強化學習 RL for NLP

將強化學習技術應用於自然語言處理任務中，透過獎勵機制優化文本生成的序列決策過程。

強化學習自然語言處理大型語言模型

自然語言處理強化學習是什麼？→

人類回饋強化學習 RLHF

人類回饋強化學習（RLHF）是一種利用人類回饋訊號，訓練強化學習模型，使其行為更符合人類偏好的方法。

強化學習大型語言模型模型訓練

人類回饋強化學習是什麼？→

旋轉位置編碼 Rotary Position Embedding

一種位置編碼方法，通過複數旋轉操作將位置信息編碼到注意力機制中，相比絕對位置編碼具有更好的外推性能。

大型語言模型深度學習神經網路

旋轉位置編碼是什麼？→

S

20 個術語

規模 Scale

規模指AI系統中模型參數、訓練資料與運算資源的量級。擴展規模可顯著提升效能，是推動大型語言模型突破的關鍵因素。

大型語言模型模型訓練深度學習

規模是什麼？→

縮放點積注意力 Scaled Dot-Product Attention

iPAS

透過計算查詢與鍵的點積並進行縮放，以決定序列中特徵間的關聯權重，是提取上下文資訊的關鍵深度學習機制。

深度學習自然語言處理神經網路

縮放點積注意力是什麼？→

規模定律 Scaling Law

規模定律描述了模型性能如何隨著模型大小、訓練數據量和計算資源的增加而變化。它提供了一種預測模型性能的經驗關係。

機器學習深度學習模型訓練

規模定律是什麼？→

自注意力機制 Self-Attention Mechanism

深度學習中根據序列內不同位置的相關性動態分配權重的機制，通過計算查詢（Query）、鍵（Key）、值（Value）的交互，使模型能關注序列中任意位置的信息，無視距離限制。

深度學習自然語言處理大型語言模型

自注意力機制是什麼？→

自監督學習 Self-supervised Learning

從未標注資料中自動建立監督信號以訓練模型的學習範式，無需人工標注。

預訓練表示學習大型語言模型

自監督學習是什麼？→

語義分析 Semantic Analysis

語義分析旨在理解文本的真實含義，超越字面解釋，提取句子或段落的深層語義結構和關係，賦予機器理解語言的能力。

自然語言處理AI基礎深度學習

語義分析是什麼？→

語意嵌入 Semantic Embedding

iPAS

將文字或概念轉換為連續向量空間中數值表示的技術，讓機器能理解並比較資料間的深層意義關聯與相似度。

自然語言處理機器學習特徵工程

語意嵌入是什麼？→

語意核心 Semantic Kernel

Semantic Kernel是一個輕量級的開源SDK，使您可以將大型語言模型（LLMs）與傳統程式語言（如C#、Python）整合，建立AI應用。

大型語言模型自然語言處理Python程式

語意核心是什麼？→

語意解析 Semantic Parsing

語意解析是將自然語言文本轉換為機器可讀的邏輯形式或結構化表示的方法，使電腦能精確理解人類意圖。

自然語言處理大型語言模型機器學習

語意解析是什麼？→

語義搜尋 Semantic Search

語義搜尋是一種理解使用者搜尋意圖和上下文的搜尋技術，超越了關鍵字匹配，旨在提供更相關和精確的搜尋結果。

自然語言處理知識圖譜機器學習

語義搜尋是什麼？→

語義空間 Semantic Space

iPAS

語義空間是將詞彙、句子或文件轉換為多維連續向量的數學模型，使電腦能計算語言的意義相似度與深層關聯。

自然語言處理機器學習大型語言模型

語義空間是什麼？→

語句片段 SentencePiece

SentencePiece 是一種獨立於語言的分詞器，它將輸入視為 Unicode 字符序列，並使用 BPE 或 Unigram 算法生成詞彙表。

自然語言處理深度學習模型訓練

語句片段是什麼？→

監督式微調 SFT (Supervised Fine-Tuning)

使用人工標注的高品質示範資料，對預訓練語言模型進行有監督訓練以使其遵循指令的技術。

後訓練指令遵循LoRA

監督式微調是什麼？→

滑動窗口注意力 Sliding Window Attention

一種高效的注意力機制，限制每個位置只與一個固定大小的局部上下文窗口內的位置進行注意力計算，減少計算複雜度。

大型語言模型深度學習神經網路

滑動窗口注意力是什麼？→

稀疏注意力機制 Sparse Attention

稀疏注意力機制是一種減少注意力機制計算複雜度的技術，透過只關注輸入序列中的部分元素，降低運算量，提升模型效率。

機器學習深度學習自然語言處理

稀疏注意力機制是什麼？→

稀疏變換器 Sparse Transformer

iPAS

稀疏變換器是一種深度學習架構，透過限制注意力機制的計算範圍降低複雜度，使其能高效處理長序列資料。

深度學習自然語言處理神經網路

稀疏變換器是什麼？→

推測解碼 Speculative Decoding

推測解碼是一種加速大型語言模型推論速度的技術，透過小型模型預測多個token，再由大型模型驗證，減少計算量。

大型語言模型模型訓練模型部署

推測解碼是什麼？→

停止序列 Stop Sequence

指定特殊的詞彙序列，當模型生成到此序列時立即停止生成，用於控制輸出長度和結構邊界。

大型語言模型Prompt工程生成式AI

停止序列是什麼？→

次詞單元化 Subword Tokenization

次詞單元化是將單詞拆分為更小的子單元（次詞）的技術，用於解決詞彙量過大和未登錄詞（OOV）問題，提升模型泛化能力。

自然語言處理深度學習模型訓練

次詞單元化是什麼？→

系統提示詞 System Prompt

系統提示詞是用於引導大型語言模型行為的初始指令，影響模型的回應風格、知識範圍和任務執行方式。

大型語言模型Prompt工程自然語言處理

系統提示詞是什麼？→

T

10 個術語

文本到文本 T5

T5 (Text-to-Text Transfer Transformer) 是一種將所有 NLP 任務轉換為文本到文本格式的轉換器模型，簡化了模型訓練和應用。

自然語言處理深度學習模型訓練

文本到文本是什麼？→

溫度採樣 Temperature Sampling

透過調整溫度參數，控制語言模型生成文本的隨機程度和多樣性。溫度越低生成越確定，溫度越高生成越隨機。

大型語言模型生成式AIPrompt工程

溫度採樣是什麼？→

張量並行 Tensor Parallelism

將單個張量（矩陣或更高維數組）的計算分割到多個 GPU 設備上，通過跨設備並行計算矩陣乘法等操作的分佈式訓練方法。

模型訓練分佈式訓練深度學習

張量並行是什麼？→

文本提示 Text Prompt

iPAS

指引AI模型生成內容的文字指令或問題，是與生成式AI互動的核心方式。

Prompt工程生成式AI大型語言模型

文本提示是什麼？→

文本摘要 Text Summarization

文本摘要是自然語言處理中的一項任務，旨在從一篇或多篇文章中生成簡潔且信息豐富的摘要。分為抽取式和生成式兩種方法。

自然語言處理機器學習深度學習

文本摘要是什麼？→

思維推理 Thought Reasoning

AI 模型透過顯式的中間推理步驟（思維鏈）將複雜問題拆解為可逐步解決的子問題，以提升多步推理任務準確率的方法。

大型語言模型推理能力提示工程

思維推理是什麼？→

符記 Token

符記是大型語言模型處理文字時，不可分割的最小單位，它可以是一個字、詞，或者更小的子詞

自然語言處理大型語言模型Prompt工程

符記是什麼？→

工具使用能力 Tool Use

工具使用能力是指大型語言模型利用外部工具（例如API、資料庫）來擴展其功能，完成更複雜任務的能力。

大型語言模型Prompt工程AI應用

工具使用能力是什麼？→

Top-K 注意力機制 Top-K Attention

iPAS

為降低自注意力複雜度的技術。透過僅保留分數最高的前 K 個鍵值對參與計算，有效減少記憶體與運算開銷。

深度學習大型語言模型最佳化

Top-K 注意力機制是什麼？→

Top-k採樣 Top-k Sampling

限制每次詞彙選擇只從機率最高的 k 個候選詞彙中進行隨機採樣，減少低機率詞彙被錯誤選中的風險。

大型語言模型生成式AIPrompt工程

Top-k採樣是什麼？→

U

1 個術語

統一知識引導生成優化框架 UNIEGO

一種在 AI 生成任務中整合結構化知識圖譜或外部知識庫以引導生成方向，同時優化輸出一致性與事實準確性的統一框架架構。

知識圖譜RAG大型語言模型

統一知識引導生成優化框架是什麼？→

V

1 個術語

向量資料庫 Vector Database

向量資料庫是一種專門儲存和檢索向量嵌入的資料庫，能高效處理高維度資料的相似性搜尋，廣泛應用於推薦系統和語義搜尋。

資料處理機器學習推薦系統

向量資料庫是什麼？→

W

2 個術語

學習率預熱策略 Warmup Schedule

iPAS

在模型訓練初期逐漸增加學習率的策略，可防止模型權重在訓練剛開始時因過大的梯度更新而崩潰或發散。

模型訓練最佳化大型語言模型

學習率預熱策略是什麼？→

語音轉錄模型 Whisper

Whisper 是 OpenAI 開發的語音辨識系統，能將語音轉換為文字，支援多種語言，並具備良好的抗噪能力和翻譯功能。

機器學習深度學習自然語言處理

語音轉錄模型是什麼？→

大型語言模型 相關 AI 術語

摘要生成技術 Abstractive Summarization

適配器模組 Adapter

AI代理 Agent

注意力線性偏置 ALiBi

對齊校準 Alignment

對齊稅 Alignment Tax

全規約演算法 All-Reduce

注意力崩潰 Attention Collapse

集束搜尋 Beam Search

模型基準測試 Bench

雙向編碼器表示 BERT

雙向語境 Bidirectional Context

雙向編碼器 Bidirectional Encoder

BERT Bidirectional Encoder Representations from Transformers

雙語評估替代指標 Bilingual Evaluation Understudy

位元組對編碼 Byte Pair Encoding

因果語言模型 Causal Language Model

思維鏈 Chain-of-Thought

思維鏈提示 Chain-of-Thought Prompting

聊天機器人 Chatbot

金吉拉縮放 Chinchilla Scaling

分塊處理 Chunking

無分類器引導 Classifier-free Guidance

完形填空任務 Cloze Task

程式碼生成 Code Generation

常識推理 Commonsense Reasoning

憲法型 AI Constitutional AI

憲法式AI原則 Constitutional AI Principles

上下文脈絡 Context

上下文窗口 Context Window

上下文窗口管理 Context Window Management

對話式人工智慧 Conversational AI

程式碼副駕駛 Copilot

語料庫 Corpus

資料分片 Data Sharding

解碼器唯一架構 Decoder-only Architecture

僅解碼器模型 Decoder-Only Model

稠密檢索模型 Dense Retrieval

對話系統 Dialogue System

直接偏好優化 Direct Preference Optimization

點積注意力 Dot Product Attention

動態批處理 Dynamic Batching

湧現能力 Emergent Abilities

少樣本提示 Few-shot Prompting

閃電注意力機制 Flash Attention

基礎模型 Foundation Model

函數呼叫 Function Calling

生成式模型 Generative Model

生成式預訓練轉換器 Generative Pre-trained Transformer

生成式預訓練模型 GPT

GRACE（圖神經網路知識編輯方法） GRACE

圖檢索增強 Graph RAG

貪婪解碼 Greedy Decoding

分組查詢注意力 Grouped Query Attention

安全護欄 Guardrails

AI 幻覺 Hallucination

混合搜尋 Hybrid Search

假設性文件嵌入 Hypothetical Document Embeddings

上下文學習 In-context Learning

上下文學習理論 In-context Learning Theory

指令微調 Instruction Tuning

越獄攻擊 Jailbreaking

知識圖譜 Knowledge Graph

鍵值緩存 KV Cache

LangChain框架 LangChain

語言處理與模型 Language

羊駝語言模型 LLaMA

羊駝索引 LlamaIndex

大型語言模型代理 LLM Agents

大型語言模型群 LLMs

邏輯形式生成 Logical Form Generation

長序列與長尾分佈 Long

長上下文 Long Context

低秩適配 LoRA

低秩適應 Low-Rank Adaptation

曼巴模型 Mamba

遮蔽語言模型 Masked Language Model

機制性可解釋性 Mechanistic Interpretability

記憶率 Memorization Rate

大型語言模型相關 AI 術語