摘要生成技術 Abstractive Summarization
摘要生成技術利用AI理解原文,並以新的句子和詞彙生成摘要,更接近人類的摘要方式,但實現難度較高。
瀏覽 AITerms.tw 中標籤為「生成式AI」的 AI 術語,快速找到定義、FAQ 與 iPAS 考試重點。
目前篩選:標籤「生成式AI」,共 97 個術語。
同一術語可隸屬多個主題,因此主題數量會重複計算。
主題標籤
A-Z 快速導覽
目前篩選:標籤「生成式AI」 ,共 97 個術語
清除篩選 同一術語可隸屬多個主題,因此主題數量會重複計算。
摘要生成技術利用AI理解原文,並以新的句子和詞彙生成摘要,更接近人類的摘要方式,但實現難度較高。
具備自主感知環境、做出決策並執行相應動作以達成特定目標的智慧型軟體實體。
對齊校準是指使AI模型,特別是大型語言模型,的行為與人類意圖、價值觀和倫理規範相符的過程,降低潛在風險。
依序根據前面所有輸出預測下一個元素的生成式模型架構。
因果語言模型是一種語言模型,它基於序列中先前詞彙預測下一個詞彙,並明確建模詞彙之間的因果關係,以提升生成文本的連貫性和可控性。
思維鏈提示是一種Prompt工程技術,透過引導模型逐步推理,提升複雜問題的解答品質與可解釋性。
一種條件生成技術,不依賴外部分類器,通過在無條件生成過程中注入條件信息來控制生成結果,常用於文本到圖像等多模態任務。
程式碼生成是指利用人工智慧模型,自動產生程式碼片段或完整程式的技術,旨在提高開發效率並降低編碼錯誤。
一種生成模型,通過學習將任意噪音水平的數據映射到同一最終樣本,實現單步或少步生成,不需要逐步去噪過程。
內容生成是指使用人工智慧技術自動創建文字、圖像、音訊或影片等內容的過程,旨在降低內容創作成本並提高效率。
AI 模型在生成回應或進行預測時,所能參考與記憶的輸入資訊範圍及歷史對話內容。
ControlNet 是一種神經網路結構,用於控制大型擴散模型,例如 Stable Diffusion,以實現更精確的圖像生成控制,例如基於草圖或邊緣圖生成圖像。
Copilot 是一個 AI 程式碼助手,透過分析程式碼上下文,提供程式碼建議、自動完成和程式碼生成,提升開發效率。
創用CC提供彈性版權許可,讓創作者分享作品,同時保留部分權利,促進知識共享與再利用。
晶體結構預測是指透過計算機演算法,從給定的化學組成預測材料在特定條件下的穩定三維晶體結構。
解碼器是神經網路的一部分,負責將編碼器產生的抽象向量表示,轉換成人類可理解的目標輸出,如文字、圖片或語音。
深度學習模型架構設計,僅使用解碼器(Decoder)層進行文本生成和處理,無需編碼器,通過因果遮蔽使模型只能關注當前位置的歷史信息,實現自迴歸文本生成。
僅解碼器模型是一種專注於自迴歸生成的架構,透過預測下一個詞彙來產生連續文本,為現代語言模型的核心。
深度偽造偵測旨在辨識經由深度學習技術偽造或操縱的影音內容,以防止不實資訊傳播和維護資訊真實性。
去噪擴散機率模型(DDPM)是一種生成模型,通過逐步添加高斯噪聲破壞資料,然後學習逆向過程,從噪聲中重建資料,實現高品質的資料生成。
將擴散模型的去雜訊生成機制應用於文字序列生成的語言模型,透過迭代精化而非自回歸逐步生成文字。
擴散模型是一種生成模型,透過逐步將雜訊還原成清晰圖像,達成從隨機雜訊生成資料的目的
直接侵權指未經授權而直接複製、散布或使用受版權保護作品的行為,在AI領域涉及模型訓練與輸出。
直接偏好優化(DPO)是一種直接利用人類偏好資料,優化語言模型,無需訓練獎勵模型的強化學習替代方案。
將空間注意力機制中不同維度或語義因素的表示分離,使模型能獨立控制空間定位與內容特徵的技術。
高斯雜訊是一種機率密度符合常態分佈的隨機干擾訊號,數值多集中於平均值,常應用於資料擴增與生成模型中。
生成分佈是指生成式人工智慧模型在給定隨機噪聲或潛在變數後,所產生的合成資料在特徵空間中呈現的機率分佈。
生成對抗網路是一種透過生成器與鑑別器互相對抗學習,最終使生成器能產出逼真資料的深度學習模型
生成式 AI 是能夠產生新內容(文字、圖像、音訊、程式碼等)的人工智慧系統,基於學習大量訓練資料的分佈特徵來生成符合語境的輸出
生成式模型(Generative Model)是能夠學習資料的機率分布並從中生成新樣本的機器學習模型,涵蓋 GAN、VAE、擴散模型等架構,廣泛應用於影像合成、文字生成與資料擴增。
GPT是一種基於Transformer架構的大型語言模型,透過預訓練學習大量文本資料,用於生成文本、翻譯語言、回答問題等。
梯度懲罰是用於穩定生成對抗網路的正則化技術,透過限制梯度範數以確保模型平滑,能防止模式崩潰。
圖結構生成是一種利用機器學習模型自動建立或擴充圖結構資料的技術,旨在模擬真實世界中節點與邊的複雜關聯網路。
貪婪解碼是一種序列生成方法,在每個時間步選擇概率最高的詞作為輸出,直到生成終止符號或達到最大長度。它簡單快速,但可能陷入局部最佳解。
AI 模型對數位圖片進行處理、分析或生成的基礎技術,涵蓋像素級的特徵萃取、語意解析與跨模態影像合成。
圖像生成是一種人工智慧技術,旨在從文字描述、其他圖像或隨機雜訊中創造出全新的、逼真的或風格化的圖像。
利用周邊像素信息自動填充或重建影像中的遺失、損壞或標記區域,用於去除物體、修復老照片等。
圖像轉文字生成是一種將視覺資訊轉換為自然語言描述的技術,使電腦能夠理解並用文字表達圖片內容。
指令微調是一種利用特定格式指令資料集,微調預訓練語言模型,使其更精確理解並執行人類指令的技術。
逆向設計是一種從目標性能出發,利用機器學習或最佳化演算法推導出滿足該性能之材料結構或系統參數的方法。
在AI中,「語言」專指機器對人類自然語言的理解與生成能力,是實現人機順暢溝通與通用人工智慧的關鍵技術橋樑。
大型語言模型是以大量文字訓練的超大 Transformer 模型,擅長理解並生成自然語言
潛在擴散模型(LDM)是一種生成式AI模型,透過在潛在空間中進行擴散和逆擴散過程,生成高解析度、高品質的圖像或其他資料。
潛在空間是機器學習模型學習到的高維資料的壓縮表示,它捕捉了資料的底層結構和關係,並將其映射到一個低維空間。
LLaMA(Large Language Model Meta AI)是 Meta 開發的開放權重(open-weight)大型語言模型系列,可免費下載、修改、自行部署,採 Meta 自訂 community license 授權,非 OSI 認證開源。
LLMs 是大型語言模型群的統稱,代表當今具備強大自然語言理解與生成能力的各類基礎模型集合。
GAN 訓練時生成器只輸出少數幾種重複樣本而喪失多樣性的訓練失敗現象。
運用生成式人工智慧模型,探索廣大化學空間並精準設計出具有特定期望性質之全新分子結構的前沿技術。
多模態 AI 能同時處理並整合多種類型的輸入資料(文字、圖像、聲音、影片等),產生跨模態的理解與輸出
音樂生成是利用AI模型自動創作音樂,涵蓋旋律、和聲、節奏等多個方面,旨在模擬人類作曲過程。
自然語言生成(NLG)是將結構化資料轉換為人類可理解的自然語言文本的AI技術,廣泛應用於報告生成、聊天機器人等。
神經輻射場景(NeRF)是一種使用神經網路表示3D場景的新穎方法,它通過學習場景的體積密度和顏色來實現逼真的渲染。
根據累積機率選擇詞彙範圍,只從機率累計達到設定閾值(如 90%)的最少詞彙中採樣,比 Top-k 更能適應不同機率分布。
Real指真實世界資料或物理環境,作為生成式AI判別真偽的基準,或強化學習訓練後最終部署落地的目標場景。
真實分佈是指母體資料在客觀現實中的機率分佈狀態,是機器學習與統計模型致力於逼近與學習的終極目標。
在生成過程中對已經出現的詞彙施加機率懲罰,抑制模型重複使用相同詞彙或短語,提高文本多樣性。
從大規模資料庫中快速且精準地找出與使用者查詢高度相關的資訊或文件的核心技術。
RAG(檢索增強生成)讓 AI 回答問題前先查詢外部知識庫,再結合查到的資料生成答案,大幅減少幻覺、提升回答準確性。
獎勵建模是訓練AI模型以預測人類對不同結果的偏好,用於強化學習中,引導模型學習符合人類價值的行為。
將強化學習技術應用於自然語言處理任務中,透過獎勵機制優化文本生成的序列決策過程。
人類回饋強化學習(RLHF)是一種利用人類回饋訊號,訓練強化學習模型,使其行為更符合人類偏好的方法。
通過學習數據分佈的梯度(評分函數)來生成數據的生成模型,使用評分匹配目標直接建模數據分佈的梯度。
Seq2Seq模型是一種將一個序列轉換為另一個序列的深度學習模型,廣泛應用於機器翻譯、文本摘要、語音辨識等任務。
Stable Diffusion 是一種潛在擴散模型,用於根據文字描述生成高質量圖像,透過迭代去噪過程,從隨機噪聲中產生逼真圖像。
指定特殊的詞彙序列,當模型生成到此序列時立即停止生成,用於控制輸出長度和結構邊界。
風格轉換是一種使用人工智慧技術,將一張圖片的風格應用到另一張圖片的內容上的方法,創造出具有新風格的圖像。
合成數據是指通過程式或演算法生成的人工數據,而非從真實世界收集的數據。它常用於訓練AI模型,特別是在真實數據稀缺或涉及隱私問題時。
合成資料生成是指透過程式或模型創建人工資料,用於訓練機器學習模型,尤其是在真實資料稀缺或難以獲取的情況下。
透過調整溫度參數,控制語言模型生成文本的隨機程度和多樣性。溫度越低生成越確定,溫度越高生成越隨機。
指引AI模型生成內容的文字指令或問題,是與生成式AI互動的核心方式。
文本摘要是自然語言處理中的一項任務,旨在從一篇或多篇文章中生成簡潔且信息豐富的摘要。分為抽取式和生成式兩種方法。
文字生成3D模型是指利用人工智慧技術,將文字描述轉換為對應的3D模型,實現從文字到視覺化模型的自動生成。
文字轉語音(TTS)是一種人工智慧技術,能將書面文字精準地轉換為自然流暢且富有表現力的人類語音,廣泛應用於語音助理、有聲書和無障礙輔助等領域。
文字生成圖像是一種人工智慧技術,它能根據文字描述自動生成對應的圖像,實現文字內容的視覺化呈現。
透過輸入自然語言描述,利用深度學習模型自動合成出符合語意內容與風格之圖像的多模態技術。
文字生成影片是一種人工智慧技術,它能根據文字描述自動生成對應的影片,將文字內容轉化為動態視覺呈現。
限制每次詞彙選擇只從機率最高的 k 個候選詞彙中進行隨機採樣,減少低機率詞彙被錯誤選中的風險。
截斷技巧是一種在生成式模型中,透過限制潛在向量採樣範圍來提升生成品質的策略,主要用多樣性來換取更高的影像或資料保真度。
變分自編碼器(VAE)是一種生成式深度學習模型,它將輸入資料壓縮成潛在空間中的機率分佈,並能從中採樣以生成多樣化且具代表性的新資料樣本。
視覺語言模型結合電腦視覺與自然語言處理,使機器能理解並生成圖像與文字之間的關聯,應用廣泛,例如圖像描述生成和視覺問答。
視覺敘事指利用連續圖像或影片傳達故事的技術。在多模態AI中,模型能將文本轉化為具連貫情節的視覺序列。
AI 生成影像或資料視覺化中的資訊誤導現象,指視覺呈現因設計選擇、生成模型偏差或操弄手法,傳遞出與事實不符或過度確信的錯誤印象。
聲音複製是指使用人工智慧技術,基於少量語音樣本,生成與目標人物聲音高度相似的合成語音。