多模態 AI 是什麼?

Multimodal AI — 多模態 AI 的完整解釋

多模態 AI 能同時處理並整合多種類型的輸入資料(文字、圖像、聲音、影片等),產生跨模態的理解與輸出

多模態 AI 的完整說明

多模態 AI(Multimodal AI)突破了單一資料類型的限制,能夠融合文字、圖像、語音等多種模態的資訊進行聯合推理。代表模型如 GPT-4V、Gemini 可以同時理解圖文。iPAS 考試重點:了解多模態架構如何整合不同感知能力,及其在醫療影像診斷、智慧製造等場域的應用。

多模態 AI 在 iPAS 考試中的重點

根據歷年統計,多模態 AI 相關題目 屬於高頻考範圍。

資料來源

← 回到 多模態 AI 快查頁

測驗你對 多模態 AI 的理解

透過模擬考系統檢驗學習成果

開始測驗