大家好,我是Python进阶者。
一、前言
前几天在Python钻石交流群【逆光】问了一个Python数据处理的问题,问题如下:请问我用cpca三方库解析地址,但是总会漏一部分解析不出来,请问这个咋整呀?我处理了,就是还剩这14个,请问要咋处理呀?
二、实现过程
这里【瑜亮老师】给了个思路如下:
最简单的办法是:把数据中的重庆市重庆市替换为重庆省重庆市,提取出来后再把重庆省替换为重庆市。
【逆光】:那直辖市岂不是都要换?我刚刚发现这种也没识别出来。只识别出了省份。。。
【瑜亮老师】:那就是识别有问题,你自己再用正则或者其他的方法识别一下城市就行了。至于你说的每个直辖市走要换的问题,无非就是一个字典替换replace的问题,连循环都用不上,而且只有4个直辖市,手写也能搞定。总共就2代码。
【逆光 】:学习一下您的简洁代码
【瑜亮老师】:就3步,替换,提取,还原。这里的代码没有考虑其他情况。仅适用于图片中给出的数据情况。因为只是要展示替换的效果,这里直接对寄件地址做了修改,实际操作中不应该这样做,应该重新生成一个新列,并在新列上提取信息,最后删除该列。
【逆光】:谢谢大神,学习了。
后来她又问了一个额外的问题:请问群里大神,这个对某一列向上取整,还有其他方法么? 不想for 循环。
【Siris】回答道:把取整操作抽象出来,然后用xitong.apply。
顺利地解决了粉丝的问题。
如果你也有类似这种Python相关的小问题,欢迎随时来交流群学习交流哦,有问必答!
三、总结
大家好,我是Python进阶者。这篇文章主要盘点了一个Python数据处理的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。
最后感谢粉丝【逆光】提出的问题,感谢【不上班能干啥!】、【瑜亮老师】、【Siris】给出的思路,感谢【莫生气】等人参与学习交流。
【提问补充】温馨提示,大家在群里提问的时候。可以注意下面几点:如果涉及到大文件数据,可以数据脱敏后,发点demo数据来(小文件的意思),然后贴点代码(可以复制的那种),记得发报错截图(截全)。代码不多的话,直接发代码文字即可,代码超过50行这样的话,发个.py文件就行。