高維(>500維)資料用 DBSCAN 全部變成噪訊點的原因為何?

iPAS 考題解析

高維(>500維)資料用 DBSCAN 全部變成噪訊點的原因為何?

  • A. 高維下距離趨同,Epsilon 閾值選擇失效 ✓ 正確答案
  • B. 使用了錯誤的距離函數
  • C. MinPts 設定太小
  • D. 資料過度標準化

詳細解析

在高維空間中,所有點之間的距離都趨於相同(維度詛咒),導致基於距離的 Epsilon 閾值失去區分能力,所有點的鄰居數量都不夠,被歸為噪訊。

難度:★★★