企業資料分析團隊使用DBSCAN(Density-Based Spatial Clustering of Applications with Noise)演算法進行顧客行為分群,並希望模型能自動區分主要群集與雜訊資料。在此演算法中,決定聚類結果的兩個主要超參數為下列何者?

iPAS 考題解析

企業資料分析團隊使用DBSCAN(Density-Based Spatial Clustering of Applications with Noise)演算法進行顧客行為分群,並希望模型能自動區分主要群集與雜訊資料。在此演算法中,決定聚類結果的兩個主要超參數為下列何者?

  • A. 特徵數與學習率
  • B. K值與距離閾值
  • C. 鄰域半徑(Epsilon ε)與最小點數(MinPts) ✓ 正確答案
  • D. 交叉熵(Cross Entropy)與權重初始化

詳細解析

DBSCAN透過鄰域半徑ε和最小點數MinPts兩個參數定義「密度」概念,若某點在ε範圍內有至少MinPts個鄰點則為核心點,群集由核心點及其可達點組成,無法被納入群集的點則被標記為雜訊。

出題年份:114 難度:★★☆