python知道 python知道
3年前
《Python3网络爬虫开发实战》
提取码:1028内容简介······本书介绍了如何利用Python3开发网络爬虫,书中首先介绍了环境配置和基础知识,然后讨论了urllib、requests、正则表达式、BeautifulSoup、XPath、pyquery、数据存储、Ajax数据爬取等内容,接着通过多个案例介绍了不同场景下如何实现数据爬取,后介绍了pyspider框架、S
Stella981 Stella981
3年前
Linux下安装nginx实现伪分布
1.安装Nginx的编译环境gccyuminstallgccc2.nginx的http模块使用pcre解析正则表达式,所以安装perl兼容的正则表达式库yuminstallypcrepcredevel3.nginx使用zlib对http包的内容进行gzipyum
Stella981 Stella981
3年前
Python网络爬虫四大选择器(正则表达式、BS4、Xpath、CSS)总结
前几天小编连续写了四篇关于Python选择器的文章,分别用正则表达式(https://www.oschina.net/action/GoToLink?urlhttps%3A%2F%2Fwww.toutiao.com%2Fi6511646916554523143%2F)、BeautifulSoup(https://www.oschina.net/ac
Stella981 Stella981
3年前
Nginx配置中Location的优先级
根据Nginx的官方文档,Location标签一共有四个修饰符,分别是:(1):表示完全匹配;(2)^~:匹配URI的前缀,并且后面的正则表达式不再匹配,如果一个URI同时满足两个规则的话,匹配最长的规则;(3)~:匹配正则表达式,大小写敏感;(4)~:匹配正则表达式,大小写不敏感;优先级:(1
Wesley13 Wesley13
3年前
Java中正则表达式的使用(常用的方法)(转)
在JDK1.3及之前的JDK版本中并没有包含正则表达式的类,如果要在Java中使用正则表达式必须使用第三方提供的正则表达式库。从JDK1.4开始提供了支持正则表达式API,它们位于java.util.regex包中。一、常见的符号的介绍  1.1 预定义字符类符号说明  .任何字符(与行结束符可
Stella981 Stella981
3年前
JavaScript基础入门10
JavaScript基础入门10\toc\正则表达式正则表达式(regularexpression)是一个描述字符模式的对象。在JavaScript中,RegExp表示正则对象。在开发的工作当中,我们经常需要使用正则表达式强大的模式匹配、文本检索、以及替换功能。简单的说,
Stella981 Stella981
3年前
JavaScript中的正则表达式详解
摘要:javascript中的正则表达式作为相当重要的知识,本文将介绍正则表达式的相关知识和用法。正则表达式(RegularExpression)是一门简单语言的语法规范,是强大、便捷、高效的文本处理工具,它应用在一些方法中,对字符串中的信息实现查找、替换和提取操作。正则表达式在人们的印象中可能是一堆无法理解的字符,但就是这些符号却实现
Python进阶者 Python进阶者
1年前
我让gpt写了一段正则表达式代码,可是运行报错,可以帮忙看看哪里出了问题?
大家好,我是皮皮。一、前言前几天在Python最强王者群【HZL】问了一个Python正则表达式的问题,这里拿出来给大家分享下。截图如下图所示:单独跑的这一行,跑出了下图这个。这个报错是你提取了4列,应该赋值给4列,而不应该是1列。二、实现过程这里【大锤子
Python进阶者 Python进阶者
1年前
这个正则 为啥同样的单号第二个就提取不出来?
大家好,我是皮皮。一、前言前几天在Python最强王者交流群【哎呦喂是豆子~】问了一个Python正则表达式数据提取的问题,一起来看看吧。大佬们请问下这个正则为啥同样的单号第二个就提取不出来?这是为啥?二、实现过程从字符串上来看,a和a1写法都是可能出现的
Python进阶者 Python进阶者
10个月前
为啥一样一样的正则表达式,去提取就提取不出来?
大家好,我是皮皮。一、前言前几天在Python最强王者交流群【哎呦喂是豆子~】问了一个Pandas数据提取的问题。问题如下图所示:大佬们为啥一样一样的正则表达式for循环就可以出结果用apply(lambdax:re.findall(pattern,x))