# 語音辨識（Speech Recognition）

語音辨識是一種將人類語音轉換為機器可理解的文字或指令的技術，使電腦能夠聽懂並處理人類語言。

## 完整說明

語音辨識（Speech Recognition），又稱自動語音辨識（Automatic Speech Recognition, ASR），是一種將人類口語轉換為文本或其他機器可理解形式的技術。其核心概念是通過分析語音訊號的聲學特徵，並將這些特徵與預先建立的聲學模型和語言模型進行比對，從而判斷語音內容。

語音辨識的發展歷程可以追溯到 20 世紀 50 年代，最初的系統只能識別少量詞彙。隨著電腦運算能力的提升和機器學習技術的發展，特別是深度學習的應用，語音辨識的準確率和應用範圍得到了顯著提高。現在，語音辨識技術廣泛應用於語音助手、智能家居、客戶服務、醫療保健等領域。

在 iPAS 初級 AI 基礎概論（L11402）考試中，語音辨識是一個重要的考點。考生需要理解語音辨識的基本原理、常見的聲學模型和語言模型、以及其在實際應用中的優缺點。理解語音辨識的評估指標，例如詞錯誤率（Word Error Rate, WER），也至關重要。掌握這些知識，能幫助考生更好地理解 AI 技術在人機交互領域的應用。

## iPAS 考試出題分析

平均佔 AI 技術類考題 5%，屬於中頻考範圍。

常見出題方向：
- 應用場景識別與分析（佔 45%）
- 技術整合方案設計（佔 35%）
- 實務應用案例判斷（佔 20%）

## 常見問題

### 什麼是語音辨識？

語音辨識是一種將人類語音轉換為機器可理解的文字或指令的技術，使電腦能夠聽懂並處理人類語言。它結合了聲學模型和語言模型，在人機交互中扮演重要角色。

### 語音辨識在 iPAS 考試中怎麼考？

iPAS 初級考試（L11402）中，語音辨識的考點包括基本概念、核心技術（聲學模型、語言模型）、評估指標（詞錯誤率）和實際應用。常見題型有選擇題、簡答題和案例分析。

### 語音辨識和哪個術語最常被混淆？

語音辨識最常與語音合成混淆。語音辨識是將語音轉換為文字，而語音合成則是將文字轉換為語音。兩者功能相反，但都是語音處理的重要組成部分，應用於不同場景。

---

來源：https://aiterms.tw/terms/speech-recognition
快查頁：https://aiterms.tw/terms/speech-recognition
深度解說：https://aiterms.tw/learning/what-is-speech-recognition