spark所有文章-最新spark相关文章汇总-第16页-HelloWorld开发者社区

•

4年前

http://blog.csdn.net/pipisorry/article/details/53257188(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Fblog.csdn.net%2Fpipisorry%2Farticle%2Fdetails%2F53257188)弹性分布

helloworld_78018081

•

4年前

阿里P8面试官都说太详细了，你值得拥有

阿里P8级架构师第九篇:千亿流量高并发高可用分布式系统之数据治理篇阿里P8级架构师第十篇:千亿流量高并发高可用分布式系统之人工智能加成篇数据融合模块1.构建画像模块2.召回策略模块3.排序模型模块ctr预估4.微服务模块5.ABTest模块6.Spark调优模块7.推荐系统落地实践阿里P8级架构师第十一篇:千亿流量高并发高

Stella981

•

4年前

Spark SQL自定义函数UDF、UDAF聚合函数以及开窗函数的使用

点击上方蓝色字体，选择“设为星标”回复”资源“获取更多资源!(https://oscimg.oschina.net/oscnet/f78bb7595ba6ab203a22cb8531551d99290.jpg)!(https://oscimg.oschina.net/oscnet/96d818e1932de5c71105

Stella981

•

4年前

Spark Streaming StreamingContext详解+和Receiver详解+updateStateByKey+基于Direct的Kafka数据源

一.StreamingContext详解有两种创建StreamingContext的方式：valconfnewSparkConf().setAppName(appName).setMaster(master);valsscnewStreamingContext(conf,S

Stella981

•

4年前

Spark Streaming 结合 Kafka 两种不同的数据接收方式比较

SparkStreaming结合Kafka两种不同的数据接收方式比较博客分类：sparkDirectKafkaInputDStream只在driver端接收数据，所以继承了InputDStream，是没有receivers的在结合SparkStreaming及Kafka的实时应用中，我们通常使用以下两个API来获

Stella981

•

4年前

Spark2.3(三十七)：Stream join Stream（res文件每天更新一份）

kafka测试数据生成：packagecom.dx.kafka;importjava.util.Properties;importjava.util.Random;importorg.apache.kafka.clients.producer.Producer;

个推技术实践

•

3年前

个推基于Flink SQL建设实时数仓实践

作为一家数据智能企业，个推在服务垂直行业客户的过程中，会涉及到很多数据实时计算和分析的场景，比如在服务开发者时，需要对App消息推送的下发数、到达数、打开率等后效数据进行实时统计；在服务政府单位时，需要对区域内实时人口进行统计和画像分析。为了更好地支撑大数据业务发展，个推也建设了自己的实时数仓。相比Storm、Spark等实时处理框架，Flink不仅具有高吞

helloworld_91538976

•

3年前

大数据建模、分析、挖掘技术应用

1.掌握大数据建模分析与使用方法。2.掌握大数据平台技术架构。3.掌握国内外主流的大数据分析与BI商业智能分析解决方案。4.掌握大数据分析在搜索引擎、广告服务推荐、电商数据分析、金融客户分析方面的应用。5.掌握主流的基于大数据Hadoop和Spark、R的大数据分析平台架构和实际应用。6.掌握基于Hadoop大数据平台的数据挖掘和数据仓库分布