聲學建模 Acoustic Modeling
在語音識別、語音合成等任務中,建立音訊特徵與語言單位(音素、詞彙)對應關係的機器學習模型。
瀏覽 AITerms.tw 中標籤為「語音辨識」的 AI 術語,快速找到定義、FAQ 與 iPAS 考試重點。
目前篩選:標籤「語音辨識」,共 16 個術語。
同一術語可隸屬多個主題,因此主題數量會重複計算。
主題標籤
A-Z 快速導覽
目前篩選:標籤「語音辨識」 ,共 16 個術語
清除篩選 同一術語可隸屬多個主題,因此主題數量會重複計算。
Seq2Seq模型是一種將一個序列轉換為另一個序列的深度學習模型,廣泛應用於機器翻譯、文本摘要、語音辨識等任務。
語者分段旨在識別音訊中不同語者的發言時間段,並將其區分開來,無需事先知道語者身份。
語音辨識是一種將人類語音轉換為機器可理解的文字或指令的技術,使電腦能夠聽懂並處理人類語言。
語音合成技術是一種將文字轉換成人類語音的技術,也稱為文字轉語音(TTS)。它廣泛應用於語音助理、導航系統和輔助科技等領域。