数据挖掘技术落地实践
主办单位:上海普瑞思管理咨询有限公司 上海创卓商务咨询有限公司
日期地址:2015年03月21-22日 深圳
培训费用:5800元/人(含培训费、资料费、午餐、税费等)
课程简介:
数据挖掘和机器学习是属于大数据的核心技术之一,以科学严谨的数据依据帮助企业做分析决策,同时其高深的理论门槛也阻挡了广大工程师的学习上手,在大数据时代,如何进行基于海量数据在成百上千的机器进行分布式数据挖掘更是需要解决的难题,本课程从实战角度出发,基于企业实际需求,深入浅出的讲解数据挖掘最常用的算法和企业场景,让工程师通俗易懂的掌握,并且进行编程落地实践培训,让抽象的算法公式完全落地工程化为企业所用。详细内容参考课程提纲:课程面向群体:初中级基础的工程师,数据分析/挖掘/大数据技术人员,企业数据建模/决策人员等等
培训周期:2天
一、大数据分析挖掘技术介绍
1、map/reduce
2、mahout数据挖掘
3、sql on hadoop
4、spark生态体系
5、R语言
6、MPI并行计算
7、GPU并行计算(深度学习)
8、fourinone并行计算
二、常用机器学习算法原理
1、决策树
2、随机森林
3、协同过滤推荐算法
4、朴素贝叶斯算法
5、k-means聚类算法
6、pagerank算法
7、逻辑回归
三、大数据挖掘业务场景和生产平台
1、互联网金融业务
2、银行客户需求业务
3、大数据分析生产平台
四、编程实践
1、迭代类机器学习编程入门-求圆周率
2、pagerank的并行化实现(*)
3、逻辑回归算法的java实现(*)
4、决策树c45,id3的java实现
5、随机森林和全树并行化实现
6、训练数据和结果模拟器
7、模型结果规则化处理
演讲嘉宾:木岩- 现为知名企业中间件首席架构师
现任某知名IT企业中间件首席架构师,前淘宝高级专家。先后在淘宝交易、淘宝中间件、集团核心系统、阿里金融等部门工作。曾任金蝶总体架构部SOA架构师,负责设计ESB。曾艰苦创业,编写和销售财务软件。
在Java技术领域从业十多年,撰写过多款开源软件,其中,淘宝分布式技术框架Fourinone为其代表作。他拥有软件著作权的代表作有:BS系列软件(包括财务进销存、OA产品、CRM等)、FMS视频会议、Flash网站生成软件(华军可下载),所有软件作品均贡献99%代码。
作品:
CoolHash数据库引擎
出版书籍:《大规模分布式系统架构与设计实战》
在线报名