術語詞典

語音辨識相關 AI 術語

瀏覽 AITerms.tw 中標籤為「語音辨識」的 AI 術語，快速找到定義、FAQ 與 iPAS 考試重點。

目前篩選：標籤「語音辨識」，共 16 個術語。

目前篩選：標籤「語音辨識」，共 16 個術語

清除篩選同一術語可隸屬多個主題，因此主題數量會重複計算。

共找到 16 個術語標籤：語音辨識清除條件

A

1 個術語

聲學建模 Acoustic Modeling

在語音識別、語音合成等任務中，建立音訊特徵與語言單位（音素、詞彙）對應關係的機器學習模型。

聲學建模深度學習訊號處理

聲學建模是什麼？→

E

2 個術語

邊緣人工智慧 Edge AI

邊緣人工智慧是指在靠近資料來源的邊緣設備上執行AI運算，而非在雲端伺服器上。可降低延遲、節省頻寬、保護隱私。

AI應用模型部署電腦視覺

邊緣人工智慧是什麼？→

梯度爆炸 Exploding Gradient

梯度爆炸是指在深度學習模型訓練中，梯度在反向傳播時變得異常巨大，導致權重更新過大，模型訓練不穩定甚至崩潰。

深度學習模型訓練神經網路

梯度爆炸是什麼？→

F

1 個術語

基礎模型 Foundation Model

基礎模型是使用大量未標記數據訓練的大型模型，可適應多種下游任務，展現出強大的泛化能力和遷移學習能力。

機器學習深度學習自然語言處理

基礎模型是什麼？→

G

1 個術語

閘控循環單元 Gated Recurrent Unit

閘控循環單元（GRU）是一種循環神經網路（RNN）的變體，旨在解決傳統RNN的梯度消失問題，更有效地捕捉長期依賴關係。

深度學習自然語言處理語音辨識

閘控循環單元是什麼？→

M

2 個術語

馬可夫假設 Markov Assumption

iPAS

一種統計假設，主張系統在給定當前狀態下，未來的演變與過去歷史狀態相互獨立，即未來只取決於現在。

統計方法強化學習自然語言處理

馬可夫假設是什麼？→

梅爾頻譜圖 Mel Spectrogram

梅爾頻譜圖是一種音訊訊號的視覺表示，它將音訊的頻率轉換到梅爾尺度上，更符合人類聽覺感知，常用於語音辨識和音訊分析。

語音辨識特徵工程資料處理

梅爾頻譜圖是什麼？→

S

4 個術語

序列到序列模型 Seq2Seq

Seq2Seq模型是一種將一個序列轉換為另一個序列的深度學習模型，廣泛應用於機器翻譯、文本摘要、語音辨識等任務。

深度學習自然語言處理語音辨識

序列到序列模型是什麼？→

語者分段 Speaker Diarization

語者分段旨在識別音訊中不同語者的發言時間段，並將其區分開來，無需事先知道語者身份。

語音辨識自然語言處理機器學習

語者分段是什麼？→

語音辨識 Speech Recognition

iPAS

語音辨識是一種將人類語音轉換為機器可理解的文字或指令的技術，使電腦能夠聽懂並處理人類語言。

語音辨識Speech RecognitionL11402 中頻

語音辨識是什麼？→

語音合成技術 Speech Synthesis

語音合成技術是一種將文字轉換成人類語音的技術，也稱為文字轉語音（TTS）。它廣泛應用於語音助理、導航系統和輔助科技等領域。

語音辨識機器學習深度學習

語音合成技術是什麼？→

T

2 個術語

文字轉語音 Text-to-Audio

文字轉語音（TTS）是一種人工智慧技術，能將書面文字精準地轉換為自然流暢且富有表現力的人類語音，廣泛應用於語音助理、有聲書和無障礙輔助等領域。

自然語言處理語音辨識生成式AI

文字轉語音是什麼？→

文字轉語音 Text-to-Speech

文字轉語音 (TTS) 技術將文字轉換為人類可理解的語音。它廣泛應用於輔助工具、語音助手和內容創作等領域。

機器學習深度學習自然語言處理

文字轉語音是什麼？→

V

2 個術語

語音助理 Voice Assistant

語音助理是一種使用語音辨識、自然語言處理等技術，讓人們透過語音指令與設備互動的AI系統。

自然語言處理語音辨識AI應用

語音助理是什麼？→

聲音複製 Voice Cloning

聲音複製是指使用人工智慧技術，基於少量語音樣本，生成與目標人物聲音高度相似的合成語音。

生成式AI機器學習深度學習

聲音複製是什麼？→

W

1 個術語

語音轉錄模型 Whisper

Whisper 是 OpenAI 開發的語音辨識系統，能將語音轉換為文字，支援多種語言，並具備良好的抗噪能力和翻譯功能。

機器學習深度學習自然語言處理

語音轉錄模型是什麼？→

語音辨識 相關 AI 術語

聲學建模 Acoustic Modeling

邊緣人工智慧 Edge AI

梯度爆炸 Exploding Gradient

基礎模型 Foundation Model

閘控循環單元 Gated Recurrent Unit

馬可夫假設 Markov Assumption

梅爾頻譜圖 Mel Spectrogram

序列到序列模型 Seq2Seq

語者分段 Speaker Diarization

語音辨識 Speech Recognition

語音合成技術 Speech Synthesis

文字轉語音 Text-to-Audio

文字轉語音 Text-to-Speech

語音助理 Voice Assistant

聲音複製 Voice Cloning

語音轉錄模型 Whisper

語音辨識相關 AI 術語