2020年要做的几件大事

Wesley13
• 阅读 532

2020年将成体系化技术输出

2019年全年“大数据技术与架构”累计发送文章304篇。 原创127篇,原创率41.8%。

技术方向包含了:

实时计算技术方向:****Flink、Spark、Kafka等

离线计算技术方向:****Hive、Hadoop、HDFS、Hbase等

语言基础技术方向:****Java基础、并发、多线程、JVM、NIO、RPC等

其他技术方向:****数仓、数据湖、数据平台/中台等

面试题相关:****这个部分直接让大部分读者收益,Cover了几乎所有上述技术方向

《大数据技术与架构》没有满足于几个特定的框架,一个小众的方向,而是基于从一个数据开发人员从入门到未来进阶中可能会遇到的问题出发,将未来可能会用到的技术完全涵盖。这么做的优点是覆盖面广。

但是,中间一段时间过于追逐热点,大量发了实时数仓和数据平台建设的文章。年初Flink的开源,加上阿里社区的大力宣传,大家也都较为关注。

但是追逐热点的不足也很多,就是不成体系

事实也证明了,大家看过太多的关于某某公司数据中台的建设架构,Flink等某个技术在实际应用中的亮眼表现。然而,太过高高在上高度汇总的会议PPT,对细节的过度屏蔽和过于频繁的版本迭代、大量的重构和方法废弃、不完善的大数据周边生态支持以及不够完美的版本平滑升级, 对一个公司的技术建设是极为不利的 。相信有很多小伙伴已经感受到了。

过于追逐热点并没有给大部分人带来实际的技术提升。开发人员首先应该关注自身技术实力,然后才能高屋建瓴的思考问题。

所以,2020年"大数据技术与架构"和几个热爱技术的读者小伙伴规划了几个技术输出内容:

1. 成体系的输出一套Flink从基础到高级的进阶教程;

2.Github上的《大数据成神之路》持续更新至少150篇精品文章;

3.体系化完善面试资料。

第一部分 : 成体系的输出一套Flink从基础到高级的进阶教程 。这部分其实在19年"大数据技术与架构"做了一部分工作,输出了一套基础入门的教程。我个人认为社区在大力推广的同时忽略掉了一个基本的问题:新手友好问题

有多少人看了几十篇云山雾罩的进阶文章,却连最基本的编程模型和异常处理都不会?

这让我想起了Dota和LOL,两个游戏在新手友好度上相差过多,Dota更好玩但入门简直是地狱级别的,与此不同的是LOL首创了新手训练营等极其友好的入门内容。显而易见,二者现在的发展早已天差地别。

第二部分 : Github上的《大数据成神之路》持续更新至少150篇精品文章 不知道有多少读者看过这个仓库:

https://github.com/wangzhiwubigdata/God-Of-BigData

2020年要做的几件大事

2019年全年到昨天截止,这个仓库累计更新165篇文章,大纲如图所示。

目前有649个STAR。中间一段时间因为生病,停更了。

2020年这个仓库会继续更新,内容会涵盖但不限于以上内容的文章。 同时会开设优秀博客专栏,将我平时看到的优秀博客分门别类整理好,删掉边边角角的啰嗦内容,只保留精华。同时鼓励大家提交自己的merge request,共同建设。

这个仓库希望在未来建设一段时间后成为大数据领域内容最全,从入门到高级教程都有的仓库。 能成为大家梳理自己的知识体系,查询各种资源的首选仓库。

也希望这个仓库成为未来进入大数据这个行业的 新手村

第三部分体系化完善面试资料。2019年,"大数据技术与架构"共发出面试相关的文章近40篇。其中包含全网络第一份Flink面试题: 《Flink面试通关手册 》。 全网被大量转载, 现在读者在网上搜到的面试题大部分都是基于此进行的扩展。

20年面试部分将是一个重点,"大数据技术与架构"会全网搜索数据方向(包含大数据框架、语言、后端等 ) 的面试题,并且进行更新。

以上的所有内容都非常欢迎大家的踊跃投稿和博客分享。

2020年将保持不低于每周1-2篇的原创文章

正如我们之前所描述的,2019年全年“大数据技术与架构”累计发送文章304篇。原创127篇,**原创率41.8%**。

"大数据技术与架构"19年接受了好几位读者的投稿,比如林夕_Yume诸葛子房等读者,不一一列举了。他们的文章我也很受启发,在此非常感谢给"大数据技术与架构"投稿的读者。

我相信读者中有很多人都有写博客的习惯。 一篇2000字的文章从构思到查找资料到写作完成不会低于3小时。19年能有40%+的原创率是非常值得骄傲的。所以,极高的原创率也是"大数据技术与架构"最与众不同的特点之一。

不做转载党是底线 。大量的CTRL+C和CTRL+V,公众号互转,不经筛选转载。然后发给读者,甚至很多文章中带有明显的错误不加以修正是对读者非常不负责的行为之一。

如果一篇文章没有经过打磨、勘误、仔细甄别,那么它本身就是垃圾。

****欢迎加我好友,朋友圈每天更新


关于好友问题,我个人会在朋友圈几乎每天更新,且永久可见。包含但是不限于每天的技术文章,最新的技术动态,其他体系化文章的更新进度等。

如果你想关注我们朋友圈动态 ,那么请扫二维码:

2020年要做的几件大事

如果你想加群交流,那么直接在公众号后台回复:【 加群

19年朋友圈同时更新了一些书评,比如对最新出版的一些技术书籍的评价等。我个人每月都会花费大量时间阅读最新的技术书籍。让大家不要花冤枉钱买垃圾书。

这是最好的时代,也是最坏的时代

正如大大所说,2020只争朝夕,不负韶华。

文章不错?点个【在看】吧!** 👇**

本文分享自微信公众号 - 大数据技术与架构(import_bigdata)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
待兔 待兔
3个月前
手写Java HashMap源码
HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程22
Jacquelyn38 Jacquelyn38
3年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
Wesley13 Wesley13
3年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Wesley13 Wesley13
3年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Stella981 Stella981
3年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Stella981 Stella981
3年前
Docker 部署SpringBoot项目不香吗?
  公众号改版后文章乱序推荐,希望你可以点击上方“Java进阶架构师”,点击右上角,将我们设为★“星标”!这样才不会错过每日进阶架构文章呀。  !(http://dingyue.ws.126.net/2020/0920/b00fbfc7j00qgy5xy002kd200qo00hsg00it00cj.jpg)  2
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
9个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这