推荐
专栏
教程
课程
飞鹅
本次共找到163条
spark
相关的信息
helloworld_78018081
•
3年前
阿里P8面试官都说太详细了,你值得拥有
阿里P8级架构师第九篇:千亿流量高并发高可用分布式系统之数据治理篇阿里P8级架构师第十篇:千亿流量高并发高可用分布式系统之人工智能加成篇数据融合模块1.构建画像模块2.召回策略模块3.排序模型模块ctr预估4.微服务模块5.ABTest模块6.Spark调优模块7.推荐系统落地实践阿里P8级架构师第十一篇:千亿流量高并发高
Wesley13
•
3年前
Spark核心类:弹性分布式数据集RDD及其转换和操作pyspark.RDD
http://blog.csdn.net/pipisorry/article/details/53257188(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Fblog.csdn.net%2Fpipisorry%2Farticle%2Fdetails%2F53257188)弹性分布
Stella981
•
3年前
Spark SQL自定义函数UDF、UDAF聚合函数以及开窗函数的使用
点击上方蓝色字体,选择“设为星标”回复”资源“获取更多资源!(https://oscimg.oschina.net/oscnet/f78bb7595ba6ab203a22cb8531551d99290.jpg)!(https://oscimg.oschina.net/oscnet/96d818e1932de5c71105
Stella981
•
3年前
Spark Streaming StreamingContext详解+和Receiver详解+updateStateByKey+基于Direct的Kafka数据源
一.StreamingContext详解有两种创建StreamingContext的方式:valconfnewSparkConf().setAppName(appName).setMaster(master);valsscnewStreamingContext(conf,S
Wesley13
•
3年前
Ubuntu16.04 下 Spark2.0.2+Hadoop2.7.3+Zookeeper3.4.9+HBase1.1.7集群环境搭建
接着上篇:https://my.oschina.net/u/988386/blog/802045(https://my.oschina.net/u/988386/blog/802045)上篇安装完成了hadoop,接下来安装zookeeper。安装zookeeper (2台机器配置基本相同)!/bin/bash
Stella981
•
3年前
Spark2.3(三十七):Stream join Stream(res文件每天更新一份)
kafka测试数据生成:packagecom.dx.kafka;importjava.util.Properties;importjava.util.Random;importorg.apache.kafka.clients.producer.Producer;
个推技术实践
•
2年前
个推基于Flink SQL建设实时数仓实践
作为一家数据智能企业,个推在服务垂直行业客户的过程中,会涉及到很多数据实时计算和分析的场景,比如在服务开发者时,需要对App消息推送的下发数、到达数、打开率等后效数据进行实时统计;在服务政府单位时,需要对区域内实时人口进行统计和画像分析。为了更好地支撑大数据业务发展,个推也建设了自己的实时数仓。相比Storm、Spark等实时处理框架,Flink不仅具有高吞
helloworld_91538976
•
2年前
大数据建模、分析、挖掘技术应用
1.掌握大数据建模分析与使用方法。2.掌握大数据平台技术架构。3.掌握国内外主流的大数据分析与BI商业智能分析解决方案。4.掌握大数据分析在搜索引擎、广告服务推荐、电商数据分析、金融客户分析方面的应用。5.掌握主流的基于大数据Hadoop和Spark、R的大数据分析平台架构和实际应用。6.掌握基于Hadoop大数据平台的数据挖掘和数据仓库分布
1
•••
15
16
17