高維(>500維)資料用 DBSCAN 全部變成噪訊點的原因為何?
iPAS 考題解析
高維(>500維)資料用 DBSCAN 全部變成噪訊點的原因為何?
- A. 高維下距離趨同,Epsilon 閾值選擇失效 ✓ 正確答案
- B. 使用了錯誤的距離函數
- C. MinPts 設定太小
- D. 資料過度標準化
詳細解析
在高維空間中,所有點之間的距離都趨於相同(維度詛咒),導致基於距離的 Epsilon 閾值失去區分能力,所有點的鄰居數量都不夠,被歸為噪訊。
難度:★★★
高維(>500維)資料用 DBSCAN 全部變成噪訊點的原因為何?
高維(>500維)資料用 DBSCAN 全部變成噪訊點的原因為何?
在高維空間中,所有點之間的距離都趨於相同(維度詛咒),導致基於距離的 Epsilon 閾值失去區分能力,所有點的鄰居數量都不夠,被歸為噪訊。