盘点一个Pandas中.str的一个常见小误区

大家好，我是皮皮。

一、前言

前几天在Python白银交流群【上海新年人】问了一个Pandas基础的问题。问题如下：大佬们，这里面的dtype，能直接改成str格式？我一开始认为只能这么看print(df.dtypes)，传统的做法我一直认为是这样子df['数学'] = df['数学'].astype(str)，不明白，上面这部，跟这部df['数学'].str.replace()是不是要同时做。

印象中这部df['数学'].str我一直认为是直接转字符串格式str了，上面df['数学'] = df['数学'].astype(str)是多余的了？还有一个疑问，是草莓大哥，在里面做了一个replace(regex={:}),但我记得用正则的时候应该是replace(****,regex=True),是不是草莓大哥做这题时又超纲了？

二、实现过程

这里【瑜亮老师】给了一个详细解答：这里的replace可以传一个字典，把所有的key替换成对应的value。

盘点一个Pandas中.str的一个常见小误区

粉丝继续提问：还有我一直不太明白df[*].str.replace与直接写replace()有啥区别？这一步df[*].str是不是把某列转成str格式？？？。

后来【论草莓如何成为冻干莓】给了一个思路如下：.str是调用Series的str方法，直接用replace是用DataFrame的replace方法。

【瑜亮老师】给了一个思路如下：df.replace还能传2个列表，用列表1的元素替换列表2中的元素，也是11对应的。上面是多对多替换。还可以传1个列表，1个元素。这种是多对一替换。你只学了个一对一替换。

盘点一个Pandas中.str的一个常见小误区

object是混合类型，里面的内容可能是数字，你是数字的25，又不是字符串的'25'，因为原df中的25是int，你替换的是字符串25，根本找不到这个，所以不替换。如果你不把int转换为str数据类型，那么无论你用df[].str.replace('25', '不及格')，还是df[].str.replace(25, '不及格')都是不行的，.str.replace 是字符串的方法，并不是把df[]中的数据变成str。

盘点一个Pandas中.str的一个常见小误区