iPAS 考題解析

生成式 AI 處理多來源資料的最佳做法為何？

中級大數據處理分析與應用難度：進階 ★★★

考試範圍定位

考試等級: 中級能力鑑定
考試科目: 大數據處理分析與應用
知識主題: 大數據在人工智慧之應用
能力指標: 大數據在生成式 AI 中的應用（L22403）

本題屬於 iPAS AI 應用規劃師中級能力鑑定「大數據處理分析與應用」科目中的「大數據在人工智慧之應用」範疇，對應的能力指標為「大數據在生成式 AI 中的應用」，涵蓋生成式模型在處理大規模語料時的技術需求等核心知識點。考生在準備這個範疇時，需要掌握相關的理論基礎與實務應用。

題目與選項

生成式 AI 處理多來源資料的最佳做法為何？

A. Data Lake 搭配 Apache Spark/Ray 分散式預處理與管線 ✓ 正確答案
B. 單節點批次處理
C. 向量資料庫索引直接餵入模型
D. 讓生成式模型自動清理資料

詳細解析

正確答案：A. Data Lake 搭配 Apache Spark/Ray 分散式預處理與管線

多來源資料（結構化、非結構化、不同格式）先存入 Data Lake，再用 Spark/Ray 做分散式清洗和轉換，建立標準化（Standardization）的資料管線。

各選項逐一解析

理解每個選項為什麼對或錯，是真正掌握這個知識點的關鍵。以下逐一分析每個選項的含義與判斷依據。

A. Data Lake 搭配 Apache Spark/Ray 分散式預處理與管線（正確）

Data Lake 能儲存各種原始資料，而 Apache Spark/Ray 提供強大的分散式處理能力，能高效清洗、轉換並建立資料管線，是處理生成式 AI 多來源資料的最佳實踐。

B. 單節點批次處理（不正確）

單節點批次處理無法應對生成式 AI 所需的大規模、多樣化資料量，會有效能瓶頸，處理效率太低，不適合多來源資料。

C. 向量資料庫索引直接餵入模型（不正確）

向量資料庫是儲存和查詢「已轉換成向量」的資料，它不能直接處理原始的多格式資料，需要前置處理才能生成向量。

D. 讓生成式模型自動清理資料（不正確）

生成式模型本身不具備自動清理原始資料的能力，它們需要乾淨、結構化的輸入才能有效運作，資料清理是前置步驟，不能依賴模型自動完成。

延伸學習

本題尚未連結特定術語，你可以從以下常見主題開始探索相關知識。

AI 基礎機器學習深度學習自然語言處理電腦視覺

進階題備考建議

▶ 本題屬於進階難度，涉及技術原理的深入理解或跨領域整合應用，需要紮實的基礎。
▶ 進階題通常需要你綜合多個知識點才能判斷，建議建立知識圖譜，把相關概念串聯起來。
▶ 如果這題答錯了，建議回頭複習相關的基礎概念，確保每一層知識都沒有漏洞。
▶ 中級考試的進階題佔比較高，建議先把初級範圍的基礎打穩，再挑戰中級進階題。

同主題考題練習

以下題目與本題屬於相同的考試範疇，建議一併練習以加強對該主題的掌握程度。

為了加速大數據環境下的 AI 模型訓練，以下哪一項為常見技術？

中級大數據處理分析與應用難度 ★★★ 114 年

拉拉網路商城的老闆擬透過機器學習的方式，利用過往的產品銷售資料，預測下一季的產品銷售數量，以調整現有的庫存水位。下列哪一個類型的模型，比較適合應用在老闆期望的預測目標？

中級大數據處理分析與應用難度 ★★☆ 114 年

考慮資料集已經填補遺漏值，參考下圖執行結果，OLS迴歸輸出顯示：R-squared=0.898，迴歸係數：youtube=0.0455、facebook=0.1891、newspaper=-0.0006，截距=3.5561，newspaper的p值=0.914（不顯著）。程式碼架構： X = df[['youtube','facebook','newspaper']] y = df['sales'] reg = 空格1 print(reg.coef_) X2 = sm.add_constant(X) model_sm = 空格2 print(model_sm.summary()) 各陳述： A: 空格1完整語法 reg = LinearRegression().fit(y, X) B: 空格1完整語法 reg = LinearRegression().fit(X, y) C: print(reg.coef_)結果為包括截距項等4個係數值 D: 空格2完整語法 sm.OLS(X2, y).fit() E: model_sm迴歸模型的所有迴歸係數在α=0.05之下具有顯著的解釋力 F: 截距項係數值為3.5561 下列哪些陳述正確？

中級大數據處理分析與應用難度 ★★☆ 114 年

iPAS AI 應用規劃師認證簡介

iPAS AI 應用規劃師能力鑑定是經濟部產業發展署推動的國家級 AI 證照制度，分為「初級」與「中級」兩個等級。初級考試包含「人工智慧基礎概論」和「生成式 AI 應用與規劃」兩個科目，著重基本概念的理解與應用。中級考試涵蓋「AI 技術應用與規劃」「大數據處理分析與應用」「機器學習技術與應用」三個科目，要求考生具備更深入的技術知識與實務能力。本題來自中級考試範圍，需要具備紮實的技術基礎才能正確作答。

開始準備 iPAS 考試

本題來自 iPAS AI 應用規劃師中級考試。想通過 iPAS 認證？從完整題庫練習開始，搭配術語詞典與備考攻略，系統化提升你的 AI 知識。

開始練習題庫進行診斷測驗中級備考指南 iPAS 總覽