Karen110 Karen110
4年前
Python爬虫 | 批量爬取今日头条街拍美图
专栏作者:霖hero,在职爬虫工程师,熟悉JS逆向与分布式爬虫。喜欢钻研,热爱学习,乐于分享。公众号后台回复入群,拉你进技术群与大佬们近距离交流。01前言大家好,我是J哥🚀在以前的文章中我们学了Ajax数据爬取,这篇文章我们以今日头条为例,通过分析Ajax请求来抓取今日头条的街拍美图,并将图片下载到本地保存下来。准备好没,我们现在开始!0
Wesley13 Wesley13
3年前
TIDB介绍
TiDB是什么?TiDB是一个分布式NewSQL数据库。它支持水平弹性扩展、ACID事务、标准SQL、MySQL语法和MySQL协议,具有数据强一致的高可用特性,是一个不仅适合OLTP场景还适合OLAP场景的混合数据库。TiDB怎么来的?著名的开源分布式缓存服务Codis的作者,PingCAP联合创始人&C
Stella981 Stella981
3年前
Spring Cloud构建微服务架构服务注册与发现
SpringCloud简介SpringCloud是一个基于SpringBoot实现的云应用开发工具,它为基于JVM的云应用开发中涉及的配置管理、服务发现、断路器、智能路由、微代理、控制总线、全局锁、决策竞选、分布式会话和集群状态管理等操作提供了一种简单的开发方式。SpringCloud包含了多个子项目(针对分布式
Stella981 Stella981
3年前
Hadoop之Mapreduce详解
1、什么是Mapreduce   Mapreduce是一个分布式运算程序的编程框架,是用户开发“基于hadoop的数据分析应用”的核心框架;Mapreduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个hadoop集群上;2、Mapreduce框架结构及核心运行机制
Stella981 Stella981
3年前
Dubbo与Zookeeper、SpringMVC整合和使用(负载均衡、容错)
!(https://oscimg.oschina.net/oscnet/771a0d0e23e340899ccabdd804af8569.gif)互联网的发展,网站应用的规模不断扩大,常规的垂直应用架构已无法应对,分布式服务架构以及流动计算架构势在必行,Dubbo是一个分布式服务框架,在这种情况下诞生的。现在核心业务抽取出来,作为独立的服务,
Stella981 Stella981
3年前
Elasticsearch最佳实践之分片使用优化
本文由云社区发表作者:老生姜一、遇到的问题  与大多数分布式系统一样,Elasticsearch按照一定的Hash规则把用户数据切分成多个分片,然后打散到不同机器进行存储,从而实现大规模数据的分布式存储。!img(https://ask.qcloudimg.com/draft/1640318/ux96q0n0u5.png
Wesley13 Wesley13
3年前
Java并发编程学习教程
一年前由于工作需要从微软技术栈入坑Java,并陆陆续续做了一个Java后台项目,目前在搞ScalaJava混合的后台开发,一直觉得并发编程是所有后台工程师的基本功,所以也学习了小一年Java的并发工具,对整体的并发理解乃至分布式都有一定的提高,所以想和大家分享一下。我的学习路线首先说说学习路线,我一开始是直接上手JCIP(JavaConc
Stella981 Stella981
3年前
Dubbo常见面试题
阅读文本大概需要3分钟。!(https://oscimg.oschina.net/oscnet/70db51c5516c4d3284e04eccf811be69.jpg)dubbo是什么dubbo是一个分布式框架,远程服务调用的分布式框架,其核心部分包含:集群容错:提供基于接口方法的透明远程过程调用,包括多协议支持,以及软负载均衡,失
Stella981 Stella981
3年前
Redis从入门到放弃系列(八) 主备同步
Redis从入门到放弃系列(八)主备同步本文例子基于:5.0.4在现在不管啥应用都谈分布式的阶段下(真的有必要???),我们的redis都会做一下主备,唔,如果redis存的数据不重要的话,其实也可以不用做\手动狗头\.为了能进一步上分布式,先让我们来了解一下CAP原理吧~Consis
一种轻量级定时任务实现 | 京东云技术团队
现在市面上有各式各样的分布式定时任务,每个都有其独特的特点,我们这边的项目因为一开始使用的是分布式开源调度框架TBSchedule,但是这个框架依赖ZK,由于ZK的不稳定性和项目老旧无人维护,导致我们的定时任务会偶发出现异常,比如:任务停止、任务项丢失、任