Python进阶者 Python进阶者
3年前
手把手教你用Python网络爬虫进行多线程采集高清游戏壁纸
一、背景介绍大家好,我是皮皮。对于不同的数据我们使用的抓取方式不一样,图片,视频,音频,文本,都有所不同,由于网站图片素材过多,所以今天我们使用多线程的方式采集某站4K高清壁纸。二、页面分析目标网站:http://www.bizhi88.com/3840x2160/如图所示,有278个页面,这里我们爬取前100页的壁纸图片,保存到本地;解析页面如图所示所哟
Wesley13 Wesley13
3年前
java爬虫
想找一些图片做桌面背景,但是又不想一张张去下载,后来就想到了爬虫。。。对于爬虫我也没具体用过,在网上一顿搜索后写了个小demo。爬虫的具体思路就是:1.调用url爬取网页信息2.解析网页信息3.保存数据刚开始还用正则去匹配,获取img标签中的src地址,但是发现有很多不便(主要我正则不太会),后来发现了jsoup这个神器。jsoup
Wesley13 Wesley13
3年前
MongoDB分片+副本集搭建
一、概念把大量的数据,根据某个条件分开来存储;举例:1000W条用户数据,根据用户名,ah开头的用户放入节点1,is的放入2,tz的放入3;分片需要:需要1n个节点,需要一个路由进程,需要一个配置库(配置节点);当客户端发送查询请求后,通过路由进程,去配置库查询用户所需的数据在哪个节点中;然由路由进程去节点取数据,返回结果到客
Stella981 Stella981
3年前
InnoDB脏页刷新机制Checkpoint
我们知道InnoDB采用WriteAheadLog策略来防止宕机数据丢失,即事务提交时,先写重做日志,再修改内存数据页,这样就产生了脏页。既然有重做日志保证数据持久性,查询时也可以直接从缓冲池页中取数据,那为什么还要刷新脏页到磁盘呢?如果重做日志可以无限增大,同时缓冲池足够大,能够缓存所有数据,那么是不需要将缓冲池中的脏页刷新到磁盘。但是,通常会有以下几
Wesley13 Wesley13
3年前
CPU知识点一览
关于CPU和程序的执行1、程序的运行过程,实际上是程序涉及到的、未涉及到的一大堆的指令的执行过程。当程序要执行的部分被装载到内存后,CPU要从内存中取出指令,然后指令解码(以便知道类型和操作数,简单的理解为CPU要知道这是什么指令),然后执行该指令。再然后取下一个指令、解码、执行,以此类推直到程序退出。2、这个取指、
Wesley13 Wesley13
3年前
Oracle汉字用户名数据脱敏长度不变,rpad函数使用
信息安全考虑,有时需要对用户名称进行数据脱敏。针对Oracle数据库,进行取数数据脱敏处理脱敏规则:长度小于9个字符,只保留前3个汉字与后3个汉字,中间全部由\填充。长度9个字及以上及奇数,隐去中间3个字;长度10个字及以上及奇数,隐去中间4个字。例如:公司名称:宇宙无敌厉害的超级大公司的杭州分公司 字段长度:18脱敏后:
Stella981 Stella981
3年前
Flappy Bird 单机版
前阶段FlappyBird很火,想来这么简单的游戏何不自己也实现一个来取个乐子.于是花了半小时山寨了一个.大概也算填补了单机版的空白吧.鉴于这只是作为自己引擎产品的Sample,所以很多没有仔细完善,物理模型也于原版有少许不同,感觉更难些.另外更多的功能也没时间加入,比如多人联网和各种扩展玩法等模式.等有兴趣再来完善吧.游戏编译于VS2013Runti
Wesley13 Wesley13
3年前
10种宝宝取名的方法
取名方法1、生肖取名法。好多父母在取名时会考虑生肖多一些,如生肖牛、兔喜草,就取个草头的字,生肖蛇喜欢待在洞中,可取口字形的字,鸡主要吃谷类食物,那就喜用豆、米、禾、麦、梁字等等。取名方法2、姓和名形成关联来取名。平时我们取名时可以考虑名字和姓关联起来,构成一个整体结构,如姓许,取名许诺。如姓钱,取名钱来、钱
Stella981 Stella981
3年前
Git 技巧
在日常开发中,我们经常需要创建新分支,如果希望新分支仅对本人可见,则创建一个本地分支,如果希望在多个成员之间共享,则创建一个远程分支,其他成员可以通过pull或fetch命令拉取远程分支。本文主要讨论远程分支的创建方法。有两种方式可以创建一个远程分支,一是在远程仓库上直接创建,例如我们可以在GitHub或码云的Web界面上创建远程分支;二是在先创建一
如何应对亚马逊反爬机制
大家都知道亚马逊是全球最大的购物平台很多商品信息、用户评价等等都是最丰富的。但是对于爬虫来说,亚马逊的反爬机制应该也是数一数二的,想要获取亚马逊数据的人很多,但是真的能成功的确是少数,所以今天小编就手把手带大家,越过亚马逊的各种反爬机制爬取你想要的商品、评论等等有用信息。这里我们可以通过以下一些步骤去实现亚马逊数据的获取。一、使用requests的get请求