Word2Vec 在大語料庫中捕捉罕見詞的最佳方法為何?

iPAS 考題解析

Word2Vec 在大語料庫中捕捉罕見詞的最佳方法為何?

  • A. Skip-gram 隨機初始化
  • B. CBOW 搭配 TF-IDF 加權
  • C. Skip-gram 以中心詞預測周圍詞語 ✓ 正確答案
  • D. CBOW 以周圍詞預測中心詞

詳細解析

Skip-gram 用中心詞預測周圍詞,對罕見詞特別有效——因為即使一個詞只出現幾次,它每次出現時都會被當作中心詞來訓練,所以能學到較好的向量表示。

難度:★★★★