Stella981 Stella981
3年前
Presto查询执行过程和索引条件下推分析
!(https://oscimg.oschina.net/oscnet/1aafc1f5402cce1406723b1589c5fc3e09b.gif)!(https://oscimg.oschina.net/oscnet/043119d0259737d52118e562fd55b04e5a8.jpg)转载本文需注明出处:微信公众号EAW
Stella981 Stella981
3年前
Presto + Superset 数据仓库及BI
基于Presto和superset搭建数据分析平台。Presto可以作为数据仓库,能够连接多种数据库和NoSql,同时查询性能很高;Superset提供了Presto连接,方便数据可视化和dashboard生成。!(https://oscimg.oschina.net/oscnet/67ca704e3b819cf48cb899c9ae87d77c
Stella981 Stella981
3年前
Apache Hudi和Presto的前世今生
一篇由ApacheHudiPMCBhavaniSudhaSaktheeswaran和AWSPresto团队工程师BrandonScheller分享ApacheHudi和Presto集成的一篇文章。1\.概述ApacheHudi是一个快速迭代的数据湖存储系统,可以帮助企业构建和管理PB级数据湖,Hudi通过引入up
Stella981 Stella981
3年前
Presto 分布式SQL查询引擎及原理分析
!(https://mmbiz.qpic.cn/mmbiz_jpg/icQbWvrFMeJU4Iyz4iahZU517dLHVB6oPz940R1qcOP9mY5nPC9gbd8c8B50K4uia1NqO6XbHYPJCGocfQYXCbCsw/640?wx_fmtjpeg)​转载本文需注明出处:微信公众号EAWorld,违者必究。
Stella981 Stella981
3年前
Apache Kylin 在中通快递的实践
摘要 ·ApacheKylin在中通是如何落地的,又是怎样赋能中通快递实现OLAP分析能力起飞的?本文从多方面对比了Presto和Kylin的优缺点,并从业务场景、调度整合、监控系统、运维调优、源码和二次开发等多个角度进行了阐述。内容涵盖:OLAP引擎在中通的发展历程;为什么选择ApacheKy
Stella981 Stella981
3年前
Hive优化的十大方法
Hive用的好,才能从数据中挖掘出更多的信息来。用过hive的朋友,我想或多或少都有类似的经历:一天下来,没跑几次hive,就到下班时间了。Hive在极大数据或者数据不平衡等情况下,表现往往一般,因此也出现了presto、sparksql等替代品。这里重点讲解hive的优化方式,例如优化分组:sethive.auto.convert.join
Stella981 Stella981
3年前
Presto在滴滴的探索与实践
!(https://oscimg.oschina.net/oscnet/880cd41883544eb1be01de38a3471372.png)桔妹导读:Presto在滴滴内部发展三年,已经成为滴滴内部AdHoc和HiveSQL加速的首选引擎。目前服务6K用户,每天读取2PB~3PBHDFS数据,处理30万亿~3
Stella981 Stella981
3年前
Apache Hudi重磅RFC解读之记录级别全局索引
1\.摘要Hudi表允许多种类型操作,包括非常常用的upsert,当然为支持upsert,Hudi依赖索引机制来定位记录在哪些文件中。当前Hudi支持分区和非分区的数据集。分区数据集是将一组文件(数据)放在称为分区的桶中的数据集。一个Hudi数据集可能由N个分区和M个文件组成,这种组织结构也非常方便hive/presto/sp
Stella981 Stella981
3年前
Presto在大数据领域的实践和探索
点击上方蓝色字体,选择“设为星标”回复”资源“获取更多资源!(https://oscimg.oschina.net/oscnet/18faf3b2bd3240e9820698af5780080e.jpg)这是《大数据技术与架构》2021年第8篇原创文章小编在去年的时候,写过一篇轰动全网的文章