如何透過 MMLSPARK 加速開發 Spark 上的機器學習專案
講者:吳宏彬 @ 微軟 時段:14:00~14:40 地點:1002 會議廳 (10F) 講題:如何透過 MMLSPARK 加速開發 Spark 上的機器學習專案 |
摘要:
MMLSPARK 是一套微軟開源在 GitHub 上的 Spark 機器學習工具套件. 它可以執行在任何 Spark2.1 Cluster 上, 包含自建環境或是由廠商如 Data Brick, Azure HDInsight 提供的 Spark 環境.
MMLSPARK 提供許多 SparkML 輔助工具, 如自動將文字資料 Featurize, index,讓 SparkML 的不同演算法可以處理. 針對深度學習的應用, MMLSpark 也提供 DNN featurization, Training on GPU node, Scalable image processing pipelines 等功能. 本講次介紹與展示如何透過 MMLSaprk 加速 SparkML 上的文字與影像處理.
講者簡介:
Been a Java Developers and .Net Developer. Work a lot on Now is a Technical Evangelist in Microsoft.
- Streaming process with Kafka Connect & Kafka Streams
- PredictionIO 架構及整合