某新創公司開發一套圖像描述生成系統,能根據輸入的照片自動產生說明文字。為了讓產生的描述文字能與圖片資訊精準對應,下列哪一種設計思路最關鍵?

iPAS 考題解析

某新創公司開發一套圖像描述生成系統,能根據輸入的照片自動產生說明文字。為了讓產生的描述文字能與圖片資訊精準對應,下列哪一種設計思路最關鍵?

  • A. 強化語言模型的句法與流暢性,確保生成文字更自然易讀
  • B. 在生成過程中結合圖片特徵與語言建模,讓模型同時利用影像內容與文字資訊 ✓ 正確答案
  • C. 調整生成策略(如 Beam Search 或溫度參數),以提升輸出文字的合理性
  • D. 專注於文字序列上下文的建模,只提升文字間的連貫性

詳細解析

圖像描述生成的核心挑戰是讓文字準確對應圖片內容。在生成過程中結合圖片特徵(視覺資訊)與語言建模(文字資訊),讓模型能同時參考兩種模態的資訊,才能產生與圖片精準對應的描述。

出題年份:114 難度:★★☆