xpath的一次性同时获取a标签和p标签的内容?(下篇)

Python进阶者
• 阅读 238

大家好,我是皮皮。

一、前言

前几天在Python白银交流群【上海新年人】问了一个Python网络爬虫数据提取的问题,一起来看看吧。他的需求就是:xpath的一次性同时获取a标签和p标签的内容。上一篇文章中,大佬们已经给出了一个答案,可是数据获取下来后发现和网页上的顺序展示并不一致,这一篇文章我们一起来看看解决办法。

xpath的一次性同时获取a标签和p标签的内容?(下篇)

二、实现过程

这里【猫药师Kelly】给了一个指导,如下所示: 碰到对位置要求严格的场景,用bs4吧。这里他给了一个提取的代码,如下://div[@class='ui-list-item-author']/*[self::p or self::a]

xpath的一次性同时获取a标签和p标签的内容?(下篇)

顺利地解决了粉丝的问题。bs4 按照节点取一层一层找,直观一点 ,而且数据获取之后,顺序方面也是和网页上的显示是一致的。

当然了,条条大路通罗马,针对该问题,还有其他的标签可以获取,也是可以一样达到数据提取目标的。

xpath的一次性同时获取a标签和p标签的内容?(下篇)

下面【瑜亮老师】也给了一个方法,如下图所示:

xpath的一次性同时获取a标签和p标签的内容?(下篇)

三、总结

大家好,我是皮皮。这篇文章主要盘点了一个Python网络爬虫数据提取的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【上海新年人】提出的问题,感谢【猫药师Kelly】、【东哥】、【巭孬🕷】给出的思路,感谢【莫生气】、【添砖java】等人参与学习交流。

【提问补充】温馨提示,大家在群里提问的时候。可以注意下面几点:如果涉及到大文件数据,可以数据脱敏后,发点demo数据来(小文件的意思),然后贴点代码(可以复制的那种),记得发报错截图(截全)。代码不多的话,直接发代码文字即可,代码超过50行这样的话,发个.py文件就行。

xpath的一次性同时获取a标签和p标签的内容?(下篇)

点赞
收藏
评论区
推荐文章
Python进阶者 Python进阶者
1年前
Python自动化办公之PDF版本发票识别并提取关键信息实战教程(上篇)
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Python自动化办公发票数据处理的问题,一起来看看吧。二、实现过程这个问题在实际工作中还是非常常见的,实用性和通用性都比较强,历史文章中其实也有写过几篇文章,这里继续给大家敲敲
Python进阶者 Python进阶者
12个月前
Python自动化办公——3个Excel表格中每个门店物品不同,想要汇总在一起(方法一)
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Python自动化办公处理的问题,一起来看看吧。原始数据如下所示:二、实现过程这里【猫药师Kelly】给了一个代码和思路,如下所示:顺利地解决了粉丝的问题。下一篇文章,我们一起来
Python进阶者 Python进阶者
12个月前
Python自动化办公——3个Excel表格中每个门店物品不同,想要汇总在一起(方法二)
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Python自动化办公处理的问题,一起来看看吧。上一篇文章中,我们已经看到了两种解决办法了,这一篇文章我们一起来看看另外一种方法。二、实现过程这里【瑜亮老师】另外再给了一个代码和
Python进阶者 Python进阶者
12个月前
3个Excel表格中每个门店物品不同,想要汇总在一起(方法三)
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Python自动化办公处理的问题,一起来看看吧。上一篇文章中,我们已经看到了第一种解决办法了,这一篇文章我们一起来看看另外一种方法。二、实现过程这里【瑜亮老师】给了一个代码和思路
Python进阶者 Python进阶者
11个月前
Python自动化办公——3个Excel表格中每个门店物品不同,想要汇总在一起(方法五)
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Python自动化办公处理的问题,一起来看看吧。上一篇文章中,我们已经看到了四种解决办法了,这一篇文章我们一起来看看另外一种方法。二、实现过程这里【论草莓如何成为冻干莓】给了un
Python进阶者 Python进阶者
11个月前
如何把某一列中包含某个值的所在行给删除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据处理的问题,一起来看看吧。大佬们,如何把某一列中包含某个值的所在行给删除?比方说把包含电力这两个字的行给删除。这里【FANG.J】指出:数据不多的话,可以在exc
Python进阶者 Python进阶者
9个月前
盘点一个AI都无法解决的Python基础题目(下篇)
大家好,我是皮皮。一、前言前几天在Python白银交流群【大侠】问了一个Pandas实战的问题,一起来看看吧。上一篇文章说到,看上去AI给的答案,似乎让【大侠】不满意,遂来白银交流群问问大佬们。这一篇文章,我们一起来看看其他大佬给的代码。二、实现过程前面的
Python进阶者 Python进阶者
9个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这
Python进阶者 Python进阶者
4个月前
爬取同样内容,xpath方法会比bs4要慢很多吗?
大家好,我是Python进阶者。一、前言前几天在Python白银交流群【沐子山树】问了一个Python网络爬虫的问题,问题如下:爬取同样内容,xpath方法会比bs4要慢很多吗?二、实现过程这里【Kimi】给了个思路如下:爬取网页内容时,使用XPath和B
Python进阶者 Python进阶者
4个月前
麻烦问一下xpath标签定位的这个索引是做什么用的?
大家好,我是Python进阶者。一、前言前几天在Python最强王者交流群【杨又串🍻】问了一个Python网络爬虫的问题,问题如下:老师,麻烦问一下xpath标签定位的这个索引是做什么用的,我听网课把这个知识点跳过了?二、实现过程后来【隔壁😼山楂】给了