iPAS 考題解析

某 NLP 模型在英文資料上的 Recall 為 0.92，遷移到繁體中文後 Recall 降至 0.61，原因最可能是？

中級機器學習技術與應用難度：中等 ★★☆ 114 年考題

考試範圍定位

考試等級: 中級能力鑑定
考試科目: 機器學習技術與應用
知識主題: 機器學習建模與參數調校
能力指標: 模型訓練、評估與驗證（L23303）

本題屬於 iPAS AI 應用規劃師中級能力鑑定「機器學習技術與應用」科目中的「機器學習建模與參數調校」範疇，對應的能力指標為「模型訓練、評估與驗證」，涵蓋模型訓練、泛化能力與穩定性評估等核心知識點。考生在準備這個範疇時，需要掌握相關的理論基礎與實務應用。

題目與選項

某 NLP 模型在英文資料上的 Recall 為 0.92，遷移到繁體中文後 Recall 降至 0.61，原因最可能是？

A. 中文的字符集過大，模型無法正確 tokenize
B. 模型在英文訓練時學到的句法結構與中文完全不相容
C. 跨語言特徵分佈差異（Domain Shift）導致模型無法泛化到目標語言 ✓ 正確答案
D. 繁體中文資料的 TF-IDF 值計算方式不同

詳細解析

正確答案：C. 跨語言特徵分佈差異（Domain Shift）導致模型無法泛化到目標語言

跨語言遷移時，源語言（英文）和目標語言（繁體中文）的特徵分佈存在顯著差異（Domain Shift），包括語法結構、詞彙語義、書寫方向等，導致在英文上訓練的模型無法直接泛化到中文，需要進行跨語言適應（如使用多語言預訓練模型 mBERT 或進行領域適應訓練）。

各選項逐一解析

理解每個選項為什麼對或錯，是真正掌握這個知識點的關鍵。以下逐一分析每個選項的含義與判斷依據。

A. 中文的字符集過大，模型無法正確 tokenize （不正確）

現代 tokenizer 能處理大字符集，不是主要問題。

B. 模型在英文訓練時學到的句法結構與中文完全不相容（不正確）

句法不兼容是其中一個原因，但更準確的說法是特徵分佈差異。

C. 跨語言特徵分佈差異（Domain Shift）導致模型無法泛化到目標語言（正確）

跨語言特徵分佈差異（Domain Shift）是主要原因，此為正確描述。

D. 繁體中文資料的 TF-IDF 值計算方式不同（不正確）

TF-IDF 計算方式不影響 Recall 的降低。

延伸學習

本題尚未連結特定術語，你可以從以下常見主題開始探索相關知識。

AI 基礎機器學習深度學習自然語言處理電腦視覺

中等題備考建議

▶ 本題屬於中等難度，需要理解概念之間的關聯與應用情境，不能只靠死背定義。
▶ 中等難度的題目常考「為什麼」和「怎麼用」，建議整理各技術的優缺點比較表。
▶ 練習時注意錯誤選項的陷阱設計，很多時候錯誤選項只有一兩個字的差異，需要仔細辨別。
▶ 建議用「費曼學習法」，嘗試向別人解釋這道題的解題思路，能講清楚就代表真正理解了。

同主題考題練習

以下題目與本題屬於相同的考試範疇，建議一併練習以加強對該主題的掌握程度。

關於準確率（Accuracy）的計算方式，下列何者正確？

中級機器學習技術與應用難度 ★★☆ 114 年

特徵縮放（Feature Scaling）中，下列何者為標準化（Standardization）的主要作用？

中級機器學習技術與應用難度 ★★☆ 114 年

下列哪一種指標通常用於評估迴歸模型的效能？

中級機器學習技術與應用難度 ★★☆ 114 年

iPAS AI 應用規劃師認證簡介

iPAS AI 應用規劃師能力鑑定是經濟部產業發展署推動的國家級 AI 證照制度，分為「初級」與「中級」兩個等級。初級考試包含「人工智慧基礎概論」和「生成式 AI 應用與規劃」兩個科目，著重基本概念的理解與應用。中級考試涵蓋「AI 技術應用與規劃」「大數據處理分析與應用」「機器學習技術與應用」三個科目，要求考生具備更深入的技術知識與實務能力。本題來自中級考試範圍，需要具備紮實的技術基礎才能正確作答。

開始準備 iPAS 考試

本題來自 114 年 AI 應用規劃師中級考試。想通過 iPAS 認證？從完整題庫練習開始，搭配術語詞典與備考攻略，系統化提升你的 AI 知識。

開始練習題庫進行診斷測驗中級備考指南 iPAS 總覽