下列哪項技術最有助於強化醫療多模態 AI 系統在處理影像與文本數據時的整合能力?
iPAS 考題解析
下列哪項技術最有助於強化醫療多模態 AI 系統在處理影像與文本數據時的整合能力?
- A. 利用預先定義的規則產生診斷結果
- B. 僅使用 CNN 架構同時處理影像與文字資訊
- C. 利用單一模態資料建立通用醫療模型
- D. 採用 Transformer 架構整合醫療影像與臨床文本資訊 ✓ 正確答案
詳細解析
Transformer 架構(特別是多模態 Transformer,如 ViLBERT、CLIP)透過自注意力機制能同時處理影像 patch 特徵和文本 token,實現跨模態的語義對齊和融合,是醫療多模態 AI 的主流方案。純 CNN 無法有效處理文本;規則系統缺乏學習能力;單一模態無法實現多模態整合。
出題年份:114 難度:★★☆