透過 Mahout 實作 Canopy 輔助 K-means 進行銀行客戶群聚分析
講者:鐘振聲 @ DS 團隊 時段:14:00~14:40 地點:1101 會議廳 (11F) 講題:透過 Mahout 實作 Canopy 輔助 K-means 進行銀行客戶群聚分析 |
摘要:
傳統聚類分析要找出最適K群的做法除了試誤法與計算 WSS (Within Cluster Sum of Squares) 外,我們嘗試在Mahout 中使用 Canopy 協助 K-means 快速找到粗略之重心以加快分群運算速度;另外將分享我們實務上如何在 Mahout 中取得各群重心資料後,在傳統關聯式資料庫環境進行分群評分。
講者簡介:
數據分析的熱愛者與十餘年的實踐者
- Building Deep Learning Pipelines on Apache Spark for ads optimization
- Real-time analytics with Flink and Druid