盘点一个Python自动化办公的问题

大家好，我是Python进阶者。

一、前言

前几天在Python铂金交流群【逆光】问了一个Python自动化办公的问题，问题如下：问题我现在有两个表a、b ，for 循环a、b ，如果a的条件满足b，则把b的值赋给a ，目前a有7万条数据，b有300条。我写的代码20分钟都没跑完。这是代码，请问改怎么解决？

盘点一个Python自动化办公的问题

二、实现过程

这里【瑜亮老师】给了个思路如下：

【瑜亮老师】：数据是在df中？

【逆光】嗯嗯，是的

【瑜亮老师】：那你不能这么写，熊猫一见for循环，思路基本就玩完。

【逆光】：请问那咋整呢？

【瑜亮老师】：你的需求是根据jd mergeTotal['付款公司编码']列中元素在 JD_zhekou中查找对应的公司名。结果保存在jd_mergeTotal['公司']列中，Total['付款公司编码']列是和zhekou['公司组织编码']对应的，都是公司的组织编码。

【逆光】：对的，本来可以用merge 但是后期可能会添加total的单量满足折扣的条件才能匹配，所以我用了for循环。

【瑜亮老师】：先merge，后期如果需要添加条件，只需要加一行对结果的筛选即可。

【逆光】：对结果的筛选？

【瑜亮老师】：先筛选，后merge。这样可以减少运算时间。而先merge后筛选，可以复用merge后的df，做更多筛选动作。看你的需求了。

【逆光】：因为我是初学哈，我不是很懂，如果先merge 那不是一对多了吗？

【瑜亮老师】：什么一对多？

【逆光】：第二个表，可能是这样啊，如果加入单量条件的话，主键编号就不是唯一的了。如果是多个关键字连接的话，单量是个范围，怎么弄进行判断呢？

【瑜亮老师】：远程吧，或者你发一个脱敏的两个表的数据。最好是你发一个脱敏数据。

【不上班能干啥！】：如果先merge，就匹配完再筛选。先筛选再匹配跟上面的结果是一样的，只是先merge过程产生的数据会多。别说加一个单量条件了，你加很多的条件也是这样的，总之先merge。

【瑜亮老师】：是的，先筛选省时，先merge可多次筛选。

【逆光】：先merge ，后再筛选，咋个筛选呢？

【瑜亮老师】：主要是根据需求。如果只是筛选一次，那就先筛选。如果后期还是会有各种筛选，那就先merge。你发一个脱敏数据吧。无非是两行代码先后顺序的问题，这个不用纠结。

【逆光】：我不知道怎么弄筛选？

【不上班能干啥！】：new_df = df1.merge(df2) new_df = new_df[new_df['判断列'] = 条件]，不就这样吗，等于，大于，小于，包含，没别的了。

【逆光】：我好像懂你的意思了，我去试一试。

【小小明】：你发个测试数据，我可以帮你写。。。你可以想个可能出现的条件，可以不用merge。给出的具体代码如下：

companies = []
nums = []
for row in jd_MergeTotal.itertuples(False):
    tmp = JD_zhekou.query(f"公司组织编码=='{row.公司编码}'")
    companies.append(tmp.公司.iat[0])
    discount_dest = None
    for _, _, num, discount in tmp.itertuples(False):
        min_v, max_v = map(int, num.split("-", maxsplit=1))
        if min_v <= row.单量 <= max_v:
            discount_dest = discount
            break
    nums.append(discount_dest)
jd_MergeTotal["公司"] = companies
jd_MergeTotal["折扣"] = nums
jd_MergeTotal

[图片上传失败...(image-d60847-1718599326279)]

顺利地解决了粉丝的问题。

如果你也有类似这种Python相关的小问题，欢迎随时来交流群学习交流哦，有问必答！