LM（語言模型）是什麼？完整定義與解說

Q: 什麼情況會用到 語言模型？

你可以把它想成一個專門猜下一個字或詞的語言機器，根據前文預測後面最可能出現什麼。 實務上只要你要處理和這個概念相符的任務，就會用到它。

自然語言處理機器學習

術語快查

搜尋意圖： 如果你在找「語言模型是什麼」或「語言模型和相近概念差在哪」，先看這頁的短定義、完整說明與延伸比較。

TL;DR： 語言模型是一種機器學習模型，用於預測給定文本序列中下一個詞彙或字符的概率分佈，是自然語言處理的基礎。

實用情境： 適合用在閱讀 AI 文章、產品文件或和同事討論時，先用一頁快速對齊概念。

下一步： 先讀完定義，再往下看範例考題與延伸比較，把概念轉成可作答的判斷。

你每次打字時，手機為什麼常常能猜到下一個詞，這背後是什麼模型？

你可以把它想成一個專門猜下一個字或詞的語言機器，根據前文預測後面最可能出現什麼。

語言模型是一種機器學習模型，用於預測給定文本序列中下一個詞彙或字符的概率分佈，是自然語言處理的基礎。

容易混淆

大型語言模型 語言模型是總稱，大型語言模型是規模更大、通常建立在 Transformer 上的版本。

字典字典只存定義，語言模型會學詞與詞怎麼接、在哪些語境出現。

記住這句就好

看前文，猜下一個。

實際案例

手機輸入法 打出「今天天氣很」時，系統會猜下一個常見詞，這就是語言模型在運作。

機器翻譯 模型要先理解前後語境，再決定下一個字該怎麼接，才能翻得順。

算法與應用

傳統 n-gram 語言模型只看前幾個詞，神經網路語言模型和 Transformer 則能看更長上下文。評估時常看困惑度，越低代表越會猜。

情境判斷

Q1（直覺題）： 如果你現在遇到一個手機輸入法的場景，這個概念會是第一個想到的工具嗎？ → 看情況，但如果任務目標和這個概念的用途一致，就很可能是。核心還是先確認你要解決的是分類、分群、壓縮、檢索，還是最佳化。

Q2（判斷題）： 如果你把它和字典一起用，結果反而變不穩，通常該怎麼想？ → 看情況。先檢查資料分布、特徵定義和模型假設是否相容，很多時候不是概念本身有問題，而是使用條件不對，像距離尺度沒對齊、標註規則不一致，或輸入格式不合。

常見問題

語言模型最容易跟大型語言模型混淆嗎？

語言模型是總稱，大型語言模型是規模更大、通常建立在 Transformer 上的版本。

什麼情況會用到語言模型？

你可以把它想成一個專門猜下一個字或詞的語言機器，根據前文預測後面最可能出現什麼。實務上只要你要處理和這個概念相符的任務，就會用到它。

初學者最常錯在哪裡？

字典只存定義，語言模型會學詞與詞怎麼接、在哪些語境出現。

範例考題

某智慧製造廠導入語音互動 AI 助理，作業人員可透過語音查詢設備狀態與操作指引。系統流程包含語音轉文字、語言模型生成回覆，以及即時查詢內部系統資料。測試結果顯示：語音轉文字在專業設備術語上錯誤率偏高；語言模型回覆偶有內容不夠精準；系統整體回應速度略慢但仍在可接受範圍。若專案目標為優先確保正確執行指令，下列改進措施的執行順序何者最合理？

A. 優化語言模型 → 強化語音模型 → 優化系統效能 → 調整生成參數
B. 強化語音模型 → 優化語言模型與知識補充 → 調整生成參數 → 優化系統效能 ✓ 正確答案
C. 優化系統效能 → 強化語音模型 → 優化語言模型與知識補充 → 調整生成參數
D. 強化語音模型 → 優化系統效能 → 優化語言模型與知識補充 → 調整生成參數

解析：

要確保正確執行指令，首先要解決語音轉文字的高錯誤率（輸入正確是基礎），其次優化語言模型的回覆精準度，再調整生成參數，最後處理速度問題（已在可接受範圍）。

某金融服務公司規劃導入生成式 AI，在評估模型部署方式時，基於內部控制與治理要求，企業考慮將大型語言模型建置於公司可管理環境，而非直接採用外部雲端服務。下列何者最能合理說明此部署決策的潛在優勢？

A. 有助提升模型回覆穩定性並降低隨機性影響
B. 可降低敏感資料需傳輸至外部服務的風險 ✓ 正確答案
C. 可直接減少模型訓練與維運所需資源投入
D. 可避免模型輸出偏差與幻覺（Hallucination）問題

解析：

將模型部署在公司內部可管理環境的核心優勢是降低敏感資料傳輸至外部的風險，符合金融業的內部控制與治理要求。

容易混淆

記住這句就好

實際案例

算法與應用

情境判斷

常見問題

相關術語

範例考題

延伸學習

看常見比較

找對應工具

資料來源與參考依據