多模態 AI 是什麼?
Multimodal AI — 多模態 AI 的完整解釋
多模態 AI 能同時處理並整合多種類型的輸入資料(文字、圖像、聲音、影片等),產生跨模態的理解與輸出
多模態 AI 的完整說明
多模態 AI(Multimodal AI)突破了單一資料類型的限制,能夠融合文字、圖像、語音等多種模態的資訊進行聯合推理。代表模型如 GPT-4V、Gemini 可以同時理解圖文。iPAS 考試重點:了解多模態架構如何整合不同感知能力,及其在醫療影像診斷、智慧製造等場域的應用。
多模態 AI 在 iPAS 考試中的重點
根據歷年統計,多模態 AI 相關題目 屬於高頻考範圍。
資料來源
- iPAS AI 應用規劃師評鑑內容範圍參考(115.02) — 經濟部產業人才能力鑑定