课程安排
一、大数据概述
二、大数据处理架构Hadoop
三、分布式文件系统HDFS
四、分布式数据库HBase
五、MapReduce
六、Spark
七、IPython Notebook运行Python Spark程序
八、Python Spark集成开发环境
九、Python Spark决策树二分类与多分类
十、Python Spark支持向量机
十一、Python Spark 贝叶斯模型
十二、Python Spark逻辑回归
十三、Python Spark回归分析
十四、Spark ML Pipeline 机器学习流程分类
十五、Python Spark 创建推荐引擎
十六、项目实践
培训目标
1.掌握大数据建模分析与使用方法。
2.掌握大数据平台技术架构。
3.掌握国内外主流的大数据分析与BI商业智能分析解决方案。
4.掌握大数据分析在搜索引擎、广告服务推荐、电商数据分析、金融客户分析方面的应用。
5.掌握主流的基于大数据Hadoop和Spark、R的大数据分析平台架构和实际应用。
6.掌握基于Hadoop大数据平台的数据挖掘和数据仓库分布式系统平台应用,以及商业和开源的数据分析产品加上Hadoop平台形成大数据分析平台的应用剖析。
7.掌握常见的机器学习算法。
关注微信公众号人工智能技术与咨询了解更多!