Stella981 Stella981
3年前
Flink on YARN部署快速入门指南
Apache Flink是一个高效、分布式、基于Java和Scala(主要是由Java实现)实现的通用大数据分析引擎,它具有分布式MapReduce一类平台的高效性、灵活性和扩展性以及并行数据库查询优化方案,它支持批量和基于流的数据分析,且提供了基于Java和Scala的API。  从Flink官方文档可以知道,目前Flink支持三大部署模式:Loca
Stella981 Stella981
3年前
Apache Flink 在快手的应用与实践
!(https://oscimg.oschina.net/oscnet/7e5b6cd8aa9543c8b2f29316fcbc379a.png)一.Flink在快手应用场景与规模1\.Flink在快手应用场景!(https://oscimg.oschina.net/oscnet/03c24
Stella981 Stella981
3年前
Flink总结
参考文章:Flink总结(https://www.oschina.net/action/GoToLink?urlhttps%3A%2F%2Fwww.jianshu.com%2Fp%2F77636f6a3143)1\.Flink简介ApacheFlink作为一款高吞吐量、低延迟的针对流数据和批数据的分布式实时处理引擎,
Stella981 Stella981
3年前
Flink的sink实战之二:kafka
欢迎访问我的GitHubhttps://github.com/zq2599/blog\_demos内容:所有原创文章分类汇总及配套源码,涉及Java、Docker、Kubernetes、DevOPS等;本篇概览本文是《Flink的sink实战》系列的第二篇,前文《Flink的sink实战之一:初探》对sink有了基本的了解,本
Stella981 Stella981
3年前
Flink Join
文章目录一.简介二.窗口Join2.1翻滚窗口(TumblingWindowJoin)2.2滑动窗口Join(SlidingWindowJoin)2.3会话窗口Join(SessionWindowJo
Stella981 Stella981
3年前
Flink(一)集群配置
三台主机centos6已经完成的工作:防火墙已关闭主机名修改完毕,ssh免密登陆配置完成jdk已安装zookeeper已经部署并运行hadoop已经部署并运行版本:flink1.8.2binscala\_2.11上传或下载flink,解压缩
Stella981 Stella981
3年前
Flink 专题
CheckPoint1\.checkpoint保留策略默认情况下,checkpoint不会被保留,取消程序时即会删除他们,但是可以通过配置保留定期检查点,根据配置当作业失败或者取消的时候,不会自动清除这些保留的检查点。java:CheckpointConfi
Stella981 Stella981
3年前
Flink简介
1. Flink的引入这几年大数据的飞速发展,出现了很多热门的开源社区,其中著名的有 Hadoop、Storm,以及后来的 Spark,他们都有着各自专注的应用场景。Spark 掀开了内存计算的先河,也以内存为赌注,赢得了内存计算的飞速发展。Spark 的火热或多或少的掩盖了其他分布式计算的系统身影。就像 Flin
Stella981 Stella981
3年前
Flink 网络传输优化技术
作为工业级的流计算框架,Flink被设计为可以每天处理TB甚至PB级别的数据,所以如何高吞吐低延迟并且可靠地在算子间传输数据是一个非常重要的课题。此外,Flink的数据传输还需要支持框架本身的特性,例如反压和用于测量延迟的latencymarker。在社区不断的迭代中,Flink逐渐积累了一套值得研究的网络栈(NetworkStack),
京东云开发者 京东云开发者
1星期前
基于图遍历的Flink任务画布模式下零代码开发实现方案
作者:京东物流吴云涛前言提交一个DataSteam的Flink应用,需要经过StreamGraph、JobGraph、ExecutionGraph三个阶段的转换生成可成执行的有向无环图(DAG),并在Flink集群上运行。而提交一个FlinkSQL应用,其