推荐
专栏
教程
课程
飞鹅
本次共找到229条
hadoop
相关的信息
Wesley13
•
3年前
MySQL Binlog同步HDFS的方案
这个问题我想只要是在做数据开发的,有一定数据实时性要求、需要做数据的增量同步的公司都会遇到。19年的时候我曾经写过一点canal的文章。现在你只要看这个文章就可以了。这篇文章是一个读者推荐给我的,原地址:https://dwz.cn/XYdYpNiI,作者:混绅士我对其中的一些内容做了修改。关系型数据库和Hadoop生态的沟通越来
Stella981
•
3年前
Netty 入门,这一篇文章就够了
Netty是Java领域有名的开源网络库,特点是高性能和高扩展性,因此很多流行的框架都是基于它来构建的,比如我们熟知的Dubbo、Rocketmq、Hadoop等,针对高性能RPC,一般都是基于Netty来构建,比如sockbolt。总之一句话,Java小伙伴们需要且有必要学会使用Netty并理解其实现原理。netty旨在为可维护的高性能、高可扩展
Wesley13
•
3年前
002_如何安装JDK以及Hadoop集群环境搭建_2台机都要配置一致
1.linux的jdk1.6安装和环境变量配置安装jdk1.6cd/usr/local/./jdk6u45linuxx64.bin配置环境变量并激活root@masterlocalvim/etc/profile.d/jdk.shexportJAVA_HOME
Stella981
•
3年前
Fourinone四合一分布式计算框架整体介绍
FourInOne(中文名字“四不像”)是一个四合一分布式计算框架,在写这个框架之前,我对分布式计算进行了长时间的思考,也看了老外写的其他开源框架,当我们把复杂的hadoop当作一门学科学习时,似乎忘记了我们想解决问题的初衷:我们仅仅是想写个程序把几台甚至更多的机器一起用起来计算,把更多的cpu和内存利用上,来解决我们数量大和计算复杂的问题,当然这个过程中要
Stella981
•
3年前
Hadoop3.x入门:详解虚拟机Ambari2.7.4安装HDP3.1.4(一)
!(https://oscimg.oschina.net/oscnet/7415565cd2666a454240addcefe8b1f2655.gif)一.虚拟机配置 我这里是用我自己的台式机装了vmware15,然后搞了三台虚拟机,我这里虚拟机配置完成后可以联网,为方便大家学习,我基本都是按照离线安装来讲的,简单的步骤不
可莉
•
3年前
10 使用 OpenCV、Kafka 和 Spark 技术进行视频流分析
问题引起基于分布式计算框架Spark的室内防盗预警系统首先用摄像头录一段视频,存在电脑里,下载一个ffmpeg的软件对视频进行处理,处理成一张张图片,然后通过hadoop里边的一个文件系统叫做hdfs进行储存,之后进行分析。用spark将hdfs中存储的图片进行读取,调用opencv的人形识别算法将图片中有人形的图片识别出来,然后就代表屋子里进人了,
Wesley13
•
3年前
Ubuntu18.04下hadoop2.10安装详细步骤(亲测有效,可供参考)
\\安装详细步骤\\首先给出安装过程需要用到的安装包:云盘连接(https://www.oschina.net/action/GoToLink?urlhttps%3A%2F%2Fpan.baidu.com%2Fs%2F1jpRn7IBcKbiztix1Ab_W9Q)提取码:rfxs解压过后里面有四个文件:
Easter79
•
3年前
Springboot集成Kafka
Kafka是一种高吞吐量的分布式发布订阅消息系统,有如下特性:通过O(1)的磁盘数据结构提供消息的持久化,这种结构对于即使数以TB的消息存储也能够保持长时间的稳定性能。高吞吐量:即使是非常普通的硬件Kafka也可以支持每秒数百万的消息。支持通过Kafka服务器和消费机集群来分区消息。支持Hadoop并行数据加载。Springboot的基本搭建和配置我
个推技术实践
•
2年前
个推技术 | Hadoop3.0时代,怎么能不懂EC纠删码技术
根据云存储服务商Backblaze发布的2021年硬盘“质量报告”,现有存储硬件设备的可靠性无法完全保证,我们需要在软件层面通过一些机制来实现可靠存储。一个分布式软件的常用设计原则就是面向失效的设计。作为当前广泛流行的分布式文件系统,HDFS需要解决的一个重要问题就是数据的可靠性问题。3.0以前版本的Hadoop在HDFS上只能采用多副本冗余的方式做数据备份
1
•••
21
22
23