某新創公司開發一套圖像描述生成系統,能根據輸入的照片自動產生說明文字。為了讓產生的描述文字能與圖片資訊精準對應,下列哪一種設計思路最關鍵?

iPAS 考題解析

某新創公司開發一套圖像描述生成系統,能根據輸入的照片自動產生說明文字。為了讓產生的描述文字能與圖片資訊精準對應,下列哪一種設計思路最關鍵?

  • A. 強化語言模型的句法與流暢性,確保生成文字更自然易讀;
  • B. 在生成過程中結合圖片特徵與語言建模,讓模型同時利用影像內容與文字資訊; ✓ 正確答案
  • C. 調整生成策略(如Beam Search或溫度參數),以提升輸出文字的合理性;
  • D. 專注於文字序列上下文的建模,只提升文字間的連貫性

詳細解析

圖像描述生成的關鍵是在生成過程中結合圖片特徵與語言建模,同時利用影像和文字資訊。

難度:★★★