Flink 是如何支撑一分钟破百亿成交额的?

Stella981
• 阅读 627

提到天猫双十一,一分钟破百亿的成交额,你肯定不会陌生,他的背后就是一套强大的流计算引擎在支撑,以便得到实时统计结果。面对日益增长的数据规模,以及越来越低时延的数据处理需求,流处理已成为每家公司数据平台的必备能力。

目前主流的流计算技术有 Apache Storm,Spark Streaming 和 Apache Flink,但真正能同时做到低时延、Exactly-Once 数据一致性保障及高吞吐的,只有 Flink 一个。而且,Flink 同时支持流处理和批处理,解决了用批来模拟流的技术局限性。

所以, 如果你要掌握未来大数据领域前瞻性技术,Flink 就是首选。

但是,Flink 的上手门槛比较高,API 不够直观和好用,不同使用模式的体验也不尽相同。所以,要真正掌握 Flink 并没有那么简单,比如:

  • 长期做 Hive 或 Spark 等大数据项目的开发,但不知道如何用流数据处理;

  • 遇到 Watermark 水印概念,不知道怎样用它来处理延时数据;

  • 离线任务完成后的一段时间,Web 端没有显示或自动消失了;

  • Flink 集群搭建在 Yarn 上,如何实现高可用才能确保集群运行正常,以及 Kerberos 认证如何配置。

这里分享给你一个 Flink 知识图谱,深入理解每个知识点,才能解决工作中的实际问题。

Flink 是如何支撑一分钟破百亿成交额的?

这张图谱出自张利兵,他是第四范式数据中台架构师,Apache Flink 社区贡献者。他在大数据领域深耕 7 年了,主导过大型国有银行云计算平台产品研发和部署,以及大数据平台产品研发和实施,著有《Flink 原理、实战与性能优化》一书。

最近,他推出了一门视频课 《Flink 核心技术与实战》 ,看了课程目录和部分内容,很想推荐给你。

在课程中,他深入剖析了 Flink Runtime 的设计与实现机制,带你掌握 Flink SQL 接口的原理与操作方法,理解 Flink DataStream API 的实践原理,并构建一个完整的实时推荐数据流系统,带你彻底拿下 Flink。

Flink 是如何支撑一分钟破百亿成交额的?

拼团+ 口令 「happy2021」

到手仅 ¥89 ,原价 ¥129

他是如何讲解 Flink 的?


通过这些年来的实战经验,学习流式计算和 Flink,有这么几个关键点:

  • 了解数据处理过程中的基本模式,包括数据输入、处理和输出;

  • 理解真实数据,因为流处理只是挖掘客观事实背后价值的手段,而只有真正理解数据,才能知道如何通过流计算产生价值;

  • 深入理解 Flink 架构,例如流计算中的常见概念:有状态计算、数据一致性保障等等,这些是掌握流计算的重要前提。

当然,还有很多知识点,例如版本更新迭代带来的新知识,这些张利兵在课程中都有一一讲解。值得一提的是:课程基于 Flink 最新 1.11.1 版本讲解,通过原理解读和实战练习,带你掌握 Flink 在实时开发过程中所涉及到的全部核心技术,主要分为四部分:

首先,带你了解 Flink 基本概念,以及如何在不同的环境中安装 Flink 集群,让你对 Flink 有一个基本的认识;

接下来,重点讲解 Flink 作业的开发与实践,学习 DataStream API 和 Table ,以及 SQL 接口的使用与相应的原理解析。同时,每个章节末尾提供了对应的练习,加深你对 Flink 的掌握;

随后,深入剖析 Flink 的核心原理,包括 Runtime 的设计与实现,常用的监控指标 Checkpoint 等等,带你了解这些指标底层的含义,以及如何在实际项目中对集群进行调优。

最后,通过一个完整的推荐项目,将所有知识点串联起来,让你真正理解和掌握 Flink。

我有足够的把握,跟他学完这门课,你可以轻松解决工作中遇到的开发难题,提升流式数据处理能力,从而真正掌握 Flink。

说了那么多,先看看目录吧👇

Flink 是如何支撑一分钟破百亿成交额的?

订阅福利


拼团+ 口令 「happy2021」

春节特惠,到手仅 ¥89 ,原价 ¥129

Flink 是如何支撑一分钟破百亿成交额的?

👆扫码免费试看

我再给大家一并推荐个非常值得一读的专栏《 Kafka核心技术与实战》 。 毋庸置疑,Kafka 是整个消息引擎领域的执牛耳者,也是大数据生态圈中颇为重量级的一员。 Apache Kafka 活跃代码贡献者胡夕,根据他的实战经验,带你从 Kafka 入门、Kafka 的基本使用、客户端详解、Kafka 原理介绍、Kafka 运维与监控以及高级 Kafka 应用系统学习 Kafka。 相信学完你一定能透彻理解 Kafka,并更好地应用。

Flink 是如何支撑一分钟破百亿成交额的?

拼团+口令「happy2021」

到手仅 ¥89 ,原价 ¥129

👇点击 「阅读原文」 ,

输入  优惠口令 「happy2021」,

以  最低价 ¥89  入手,仅限前 100 人。

本文分享自微信公众号 - 大数据技术与架构(import_bigdata)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Wesley13 Wesley13
3年前
java将前端的json数组字符串转换为列表
记录下在前端通过ajax提交了一个json数组的字符串,在后端如何转换为列表。前端数据转化与请求varcontracts{id:'1',name:'yanggb合同1'},{id:'2',name:'yanggb合同2'},{id:'3',name:'yang
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
待兔 待兔
5个月前
手写Java HashMap源码
HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程22
Jacquelyn38 Jacquelyn38
3年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
Wesley13 Wesley13
3年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Wesley13 Wesley13
3年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Stella981 Stella981
3年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
11个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这