推荐
专栏
教程
课程
飞鹅
本次共找到162条
spark
相关的信息
Stella981
•
3年前
Flink及Storm、Spark主流流框架比较
转自:http://www.sohu.com/a/142553677\_804130(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Fwww.sohu.com%2Fa%2F142553677_804130)引言随着大数据时代的来临,大数据产品层出不穷。我们最近也对一款业内非常火的大
Wesley13
•
3年前
2020大数据面试题真题总结(附答案)
版本更新时间更新内容v1.020200701新建v1.120200613朋友面试大数据工程师提供的关于架构及数仓方面的题目v1.220200808朋友面试数据专家提供的数据驱动,spark及flink方面面试题v1.320200822朋友面试数据开发提供的关于hive及数仓方面的题目
Stella981
•
3年前
Clickhouse v18编译记录
简介ClickHouse是“战斗民族”俄罗斯搜索巨头Yandex公司开源的一个极具"战斗力"的实时数据分析数据库,是面向OLAP的分布式列式DBMS,圈内人戏称为“喀秋莎数据库”。ClickHouse有一个简称"CK",与Hadoop、Spark这些巨无霸组件相比,ClickHouse很轻量级,其特点:列式存
Stella981
•
3年前
Spark Core读取ES的分区问题分析
ES也是比较火热,在日志数据分析,规则分析等确实很方便,说实话用esstack浪尖觉得可以解决很多公司的数据分析需求。极客时间下周一要上线新的ES课程,有需要的暂时别购买,到时候还找浪尖返现吧。写这篇文章的原因是前两天星球球友去面试,面试管问了一下,Spark分析ES的数据,生成的RDD分区数跟什么有关系呢?稍微猜测一下就能想到
京东云开发者
•
11个月前
Spark SQL五大关联策略
1、五种连接策略选择连接策略的核心原则是尽量避免shuffle和sort的操作,因为这些操作性能开销很大,比较吃资源且耗时,所以首选的连接策略是不需要shuffle和sort的hash连接策略。◦BroadcastHashJoin(BHJ):广播散列连接◦
京东云开发者
•
4个月前
Apache顶级项目ShardingSphere — SQL Parser的设计与实现
导语:SQL作为现代计算机行业的数据处理事实标准,是目前最重要的数据处理接口之一,从传统的DBMS(如MySQL、Oracle),到主流的计算框架(如spark,flink)都提供了SQL的解析引擎,因此想对sql进行精细化的操作,一定离不开SQLPars
1
•••
10
11
12
•••
17