Irene181 Irene181
4年前
手把手教你用Scrapy爬虫框架爬取食品论坛数据并存入数据库
大家好,我是杯酒先生,这是我第一次写这种分享项目的文章,可能很水,很不全面,而且肯定存在说错的地方,希望大家可以评论里加以指点,不胜感激!一、前言网络爬虫(又称为网页蜘蛛,网络机器人),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。百度百科    说人话就是,爬虫是用来海量规则化获取数据
Irene181 Irene181
4年前
手把手教你用Scrapy爬虫框架爬取食品论坛数据并存入数据库
大家好,我是杯酒先生,这是我第一次写这种分享项目的文章,可能很水,很不全面,而且肯定存在说错的地方,希望大家可以评论里加以指点,不胜感激!一、前言网络爬虫(又称为网页蜘蛛,网络机器人),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。百度百科    说人话就是,爬虫是用来海量规则化获取数据
Stella981 Stella981
3年前
IM开发基础知识补课(三):快速理解服务端数据库读写分离原理及实践建议
本文正文部分引用了58同城架师沈剑的文章,非常感谢他的分享。1、前言IM应用从服务端数据的角度来看,它是一种很特殊的应用场景,抛开基础数据、增值业务和附属功能不谈,单从IM聊天工具的立身之本——聊天数据来说,理论上是不需要在服务端存储的(或者说只需要短暂存储——比如离线消息,上线即拉走),这也是为什么微信在前段时间号称绝不存储用户聊天数
Stella981 Stella981
3年前
MEAN架构实战:基于MongoDB、Express、Angular、Node.js构建企业级应用
曾几何时,业界流行使用LAMP架构(Linux、Apache、MySQL和PHP)来快速开发中小网站。LAMP是开放源代码的,而且使用简单、价格廉价,因此LAMP这个组合成为了当时开发中小网站的首选,号称“平民英雄”。而今,随着Node.js的流行,这使得JavaScript终于能够在服务器端拥有了一席之地。JavaScript成为了从前端到后端再到数据库层
Stella981 Stella981
3年前
2019百度阿里Java面试题(基础+框架+数据库+分布式+JVM+多线程)
前言很多朋友对面试不够了解,不知道如何准备,对面试环节的设置以及目的不够了解,因此成功率不高。通常情况下校招生面试的成功率低于1%,而社招的面试成功率也低于5%,所以对于候选人一定要知道设立面试的初衷以及每个环节的意义,有的放矢...!(https://pic4.zhimg.com/v2627aa38e467431e36038f2d7c22a8
可莉 可莉
3年前
2019百度阿里Java面试题(基础+框架+数据库+分布式+JVM+多线程)
前言很多朋友对面试不够了解,不知道如何准备,对面试环节的设置以及目的不够了解,因此成功率不高。通常情况下校招生面试的成功率低于1%,而社招的面试成功率也低于5%,所以对于候选人一定要知道设立面试的初衷以及每个环节的意义,有的放矢...!(https://pic4.zhimg.com/v2627aa38e467431e36038f2d7c22a8
Stella981 Stella981
3年前
2021最新发布百度云面经总结:Java并发+Redis+数据库+分布式
!ç¾åº¦äºJavaç¤¾æææ¯3é¢é¢ç»æ»ç»ï¼Javaå¹¶åRedisæ°æ®åºåå¸å¼(https://imgblog.csdnimg.cn/img_convert/4e2bbd90caba502199a20ad25fb6381a.png)
可莉 可莉
3年前
2021最新发布百度云面经总结:Java并发+Redis+数据库+分布式
!ç¾åº¦äºJavaç¤¾æææ¯3é¢é¢ç»æ»ç»ï¼Javaå¹¶åRedisæ°æ®åºåå¸å¼(https://imgblog.csdnimg.cn/img_convert/4e2bbd90caba502199a20ad25fb6381a.png)
京东云开发者 京东云开发者
5个月前
一次线上生产库的全流程切换完整方案
作者:京东零售杨亚龙一、现状梳理需要改造的xx系统为一个较为陈旧的技术栈系统,其中MongoDB作为核心数据存储中间件,承担着存储全部xx数据的重要任务。该系统目前的配置为1主1副本模式,涉及1个数据库和2张表,服务于7个不同的应用。尽管系统架构相对简单,