python爬虫实践之IP的使用
Python爬虫常常会面临自己ip地址被封的情况,也许刚入行的小白就只能等ip解封之后再进行接下来的操作了,但是这样的方式却是最不能借鉴的,万一数据需求量大,那要等到猴年马月呢?所以今天我们就来探讨下如何创建一个IP池并对其进行管理。对刚入行的小白很有帮助,希望大家耐心看下去,需要的朋友可以参考下。很多的网站都有反爬机制,其中就有这样一条,就是服务器会检查请
MYSQL-INNODB索引构成详解
对于MYSQL的INNODB存储引擎的索引,大家是不陌生的,都能想到是B树结构,可以加速SQL查询。但对于B树索引,它到底“长”得什么样子,它具体如何由一个个字节构成的,这些的基础知识鲜有人深究。本篇文章从MYSQL行记录开始说起,层层递进,包括数据页,B树聚簇索引,B树二级索引,最后在文章末尾给出MYSQL索引的建议。文章涉及较多基础知识,内容较为枯燥,因此采用较多的图片补充说明,希望能对读者有帮助。
CuterCorley CuterCorley
3年前
Python 不用selenium 带你高效爬取京东商品评论
一、项目说明1.项目背景一天,一朋友扔给我一个链接,让我看看这个歌商品的所有评论怎么抓取,我打开一看,好家伙,竟然有近300万条评论,不是一个小数目啊。但是仔细一看,原来有234万的评论是默认好评,还是有少部分是有价值的评价的。经过进一步观察,可以看到显然,网页中显示的只有100页数据,每页显示10条,通常可以用selenium点击每一页然后获取
Aidan075 Aidan075
3年前
自动化办公 | (升级版)批量将Excel中的url链接转成图片②
大家好,我是小五🚀前面我们使用,结果读者后来跟我反馈又遇到了一些问题。于是乎,干脆对前几天的代码升级一波。需求简介具体原始数据和期望结果如下图所示:但这位读者朋友又遇到了一个问题👇解决当url为空时代码停止运行的问题将图片保存到新增文件夹,大概有1.4W张图片,后续删图片有难度第一个问题呢,只需加个判断语句就可以。至于将图片保存到
linux 文件权限
当我们部署皕杰报表时,有时需要对文件赋予权限。linux文件对不同用户可以分别设置权限,管理员(root)有所有权限。文件权限解释查看路径下所有文件的命令:ll或者lsl查询结果列出了当前路径下的文件和文件夹,每行数据以相同格式显示。第一个字符常见的两种,d和,d表示文件夹,表示文件。还有l表示链接,软链接比较常见,如图:从第二个字符开始,每三个一组
Wesley13 Wesley13
2年前
mysql触发器 当记录的指定字段发生变化时,更新表中的另外一个字段,或者更新另外一张关联表中关联记录的字段
注意:语句中出现的old,new,now(),都为数据库自带的关键字,此处不做解释。两种情况:    第一种:一张表中,更新某条记录的其中的一个字段,触发指定的触发器,记录时间即更新到这条记录中的另一个字段中。    第二种:两张表,当A表更新其中某条记录的某个字段时,触发指定的触发器,更新B表与A表关联的记录的某个字段。对于
Wesley13 Wesley13
2年前
VC++网络安全编程范例(2)
数字证书采用公钥体制,即利用一对互相匹配的密钥进行加密、解密。每个用户自己设定一把特定的仅为本人所知的私有密钥(私钥),用它进行解密和签名;同时设定一把公共密钥(公钥)并由本人公开,为一组用户所共享,用于加密和验证签名。当发送一份保密文件时,发送方使用接收方的公钥对数据加密,而接收方则使用自己的私钥解密,这样信息就可以安全无误地到达目的地了。通过数字的手段
Wesley13 Wesley13
2年前
Java序列化技术即将被废除!!!
我们的对象并不只是存在内存中,还需要传输网络,或者保存起来下次再加载出来用,所以需要Java序列化技术。Java序列化技术正是将对象转变成一串由二进制字节组成的数组,可以通过将二进制数据保存到磁盘或者传输网络,磁盘或者网络接收者可以在对象的属类的模板上来反序列化类的对象,达到对象持久化的目的。如果你还不熟悉Java序列化技术,请详细阅读《关于Jav
Stella981 Stella981
2年前
24小时学通Linux内核之如何处理输入输出操作
   Linux内核是如何将软硬件结合起来的呢?这里我们将一起探究内核与周围硬件主要是文件IO和硬件设备之间的关系,来解释这个问题。处理器与周围设备的通信依赖于一系列的电路电线,总线就是具有类似功能的电线,设备与处理器通信主要是通过地址总线,数据总线,控制总线来实现,这里在学习单片机原理的时候也提到过,这里对系统的基本结构就不多说了,觉得更新快,不好讲解,
Wesley13 Wesley13
2年前
mq的概念(一种互联网项目开发方式)
前言现在一个互联网时代,也是一个大数据时代。随着互联网的高速发展,对产品的要求越来越高。尽管现在IT技术也已经很成熟,但是还有很多刚开始接触互联网项目的团队却不知道如何下手。前两天我见了一名创业者,与他公司的技术负责人了解了一下他们的项目架构,觉得很有问题,但是他们已经开发了半年之久要想从根本解决问题已经不太容易了。关于mq思想,就是想讲给那些即