企業資料分析團隊使用DBSCAN(Density-Based Spatial Clustering of Applications with Noise)演算法進行顧客行為分群,並希望模型能自動區分主要群集與雜訊資料。在此演算法中,決定聚類結果的兩個主要超參數為下列何者?
iPAS 考題解析
企業資料分析團隊使用DBSCAN(Density-Based Spatial Clustering of Applications with Noise)演算法進行顧客行為分群,並希望模型能自動區分主要群集與雜訊資料。在此演算法中,決定聚類結果的兩個主要超參數為下列何者?
- A. 特徵數與學習率
- B. K值與距離閾值
- C. 鄰域半徑(Epsilon ε)與最小點數(MinPts) ✓ 正確答案
- D. 交叉熵(Cross Entropy)與權重初始化
詳細解析
DBSCAN透過鄰域半徑ε和最小點數MinPts兩個參數定義「密度」概念,若某點在ε範圍內有至少MinPts個鄰點則為核心點,群集由核心點及其可達點組成,無法被納入群集的點則被標記為雜訊。
出題年份:114 難度:★★☆