大数据

helloworld_61111513
• 阅读 425

课程安排

一、大数据概述

二、大数据处理架构Hadoop

三、分布式文件系统HDFS

四、分布式数据库HBase

五、MapReduce

六、Spark

七、IPython Notebook运行Python Spark程序

八、Python Spark集成开发环境

九、Python Spark决策树二分类与多分类

十、Python Spark支持向量机

十一、Python Spark 贝叶斯模型

十二、Python Spark逻辑回归

十三、Python Spark回归分析

十四、Spark ML Pipeline 机器学习流程分类

十五、Python Spark 创建推荐引擎

十六、项目实践

培训目标

1.掌握大数据建模分析与使用方法。

2.掌握大数据平台技术架构。

3.掌握国内外主流的大数据分析与BI商业智能分析解决方案。

4.掌握大数据分析在搜索引擎、广告服务推荐、电商数据分析、金融客户分析方面的应用。

5.掌握主流的基于大数据Hadoop和Spark、R的大数据分析平台架构和实际应用。

6.掌握基于Hadoop大数据平台的数据挖掘和数据仓库分布式系统平台应用,以及商业和开源的数据分析产品加上Hadoop平台形成大数据分析平台的应用剖析。

7.掌握常见的机器学习算法。

来源:www.chinaai.org.cn

关注微信公众号人工智能技术与咨询了解更多!

点赞
收藏
评论区
推荐文章
DevOpSec DevOpSec
3年前
Jenkins安装配置,项目发布、管理详解,史上最清晰,值得收藏!
Jenkins安装配置,项目发布、管理详解,史上最清晰,值得收藏!:一、导语二、Jenkins介绍三、基础环境准备四、Jenkins安装五、Jenkins配置六、源码构建、打包、部署、运行七、常见问题汇总八、后记九、黑色小幽默一、导语Jenk
桃浪十七丶 桃浪十七丶
3年前
云计算与Hadoop期末考试知识点复习
七、八、九、十、十二、十三放到一起理解。一、大数据的概念和特点、分类又称巨量数据,是指数据量达到无法用人脑,甚至现有工具获取,处理,并整理成为帮助企业经营决策更积极目的的资讯。特点:数据量大,类型多,时效性,速度快,真实性。分类:传统企业数据,机器和传感器数据,社交数据。二、云计算的概念,特点云计算是基于互联网的计算机方式,通过这计算方式,可以把共享的
Wesley13 Wesley13
3年前
5步教你将MRS数据导入DWS
摘要:GaussDB(DWS)支持在相同网络中,配置一个GaussDB(DWS)集群连接到一个MRS集群,然后将数据从HDFS中的文件读取到GaussDB(DWS)。MapReduce服务(MapReduceService,简称MRS)是一个基于开源Hadoop生态环境而运行的大数据集群,对外提供大容量数据的存储和分析能力,可解决用户的数据
Wesley13 Wesley13
3年前
JSP学习笔记
JSP学习笔记一、JSP指令1二、JSP注释和JSP的脚本元素:2三、JSP九大对象2四、九大对象的用法3五、四个域6六、Jsp动作7七、自定义标签7八、web地址的写法7九、el表达式7经常使用的对象El表达式隐含对象域pageContextrequ
Stella981 Stella981
3年前
Hadoop压缩
一、Hadoop压缩简介1、hadoop的3个阶段(1)分布式文件系统HDFS(2)分布式编程框架MapReduce(3)yarn框架2、Hadoop数据压缩MR操作过程中进行大量数据传输。压缩技术能够有效的减少底层存储(HDFS)读写字
Wesley13 Wesley13
3年前
(二)大数据生态圈集群搭建之
搭建流程说明下载安装包高可用完全分布式搭建一.集群规划二.hadoop安装配置三.zookeeper安装配置四.集群格式化五.启动,操作,关闭集群六.访问NameNode的WebUI页面七.搭建Hadoop的client说明
Wesley13 Wesley13
3年前
MySQL之锁、事务、优化、OLAP、OLTP
本节目录一锁的分类及特性二表级锁定(MyISAM举例)三行级锁定四查看死锁、解除锁五事务六慢日志、执行计划、sql优化七OLTP与OLAP的介绍和对比八关于autocommit的测试一锁的分类及特性  数据库锁定机制简单来说,就是数据库为了保证数据的一致性,而使各种共享资源在被并发访问变得有序所设计的一种规则。对于任何
Wesley13 Wesley13
3年前
KNN分类算法原理分析及代码实现
1、分类与聚类的概念与区别分类:是从一组已知的训练样本中发现分类模型,并且使用这个分类模型来预测待分类样本。目前常用的分类算法主要有:朴素贝叶斯分类算法(NaïveBayes)、支持向量机分类算法(SupportVectorMachines)、KNN最近邻算法(kNearestNeighbors)、神经网络算法(NNet)以及决策树(De
Wesley13 Wesley13
3年前
MySQL之多表查询
阅读目录一多表联合查询二多表连接查询三复杂条件多表查询四子语句查询五其他方式查询六 SQL逻辑查询语句执行顺序(重点)七外键约束八其他约束类型九表与表之间的关系一.多表联合查询!
大数据建模、分析、挖掘技术应用
时间2022年8月5日—2022年8月9日北京(同时转线上直播)(5日报到,6日9日上课)课程第一天一、大数据概述二、大数据处理架构Hadoop三、分布式文件系统HDFS四、分布式数据库HBase第二天五、MapReduce六、Spark七、IPythonNotebook运行PythonSpark程序八、PythonSpark集成开发环境第三
helloworld_61111513
helloworld_61111513
Lv1
男人要豪爽,喝酒要喝双。
文章
3
粉丝
2
获赞
6