某新創公司開發一套圖像描述生成系統,能根據輸入的照片自動產生說明文字。為了讓產生的描述文字能與圖片資訊精準對應,下列哪一種設計思路最關鍵?
iPAS 考題解析
某新創公司開發一套圖像描述生成系統,能根據輸入的照片自動產生說明文字。為了讓產生的描述文字能與圖片資訊精準對應,下列哪一種設計思路最關鍵?
- A. 強化語言模型的句法與流暢性,確保生成文字更自然易讀
- B. 在生成過程中結合圖片特徵與語言建模,讓模型同時利用影像內容與文字資訊 ✓ 正確答案
- C. 調整生成策略(如 Beam Search 或溫度參數),以提升輸出文字的合理性
- D. 專注於文字序列上下文的建模,只提升文字間的連貫性
詳細解析
圖像描述生成的核心挑戰是讓文字準確對應圖片內容。在生成過程中結合圖片特徵(視覺資訊)與語言建模(文字資訊),讓模型能同時參考兩種模態的資訊,才能產生與圖片精準對應的描述。
出題年份:114 難度:★★☆