大家好,我是Python进阶者。
一、前言
前几天在Python最强王者交流群【小马哥】问了一个Python自动化办公的问题。问题如下:
群里大神帮看看我程序哪里错了?谢谢。我估计是isin这里出了问题,但找不到原因,我的期望是想在这个excel的M4格子里写一个值:test3awertwtrwelbert,但现在总是写到M2这个格子里
二、实现过程
这里【隔壁😼山楂】给了一个指导,如下所示:
为啥不直接用pandas,你这个这么简单的东西来来回回的倒腾
【小马哥】:因为对pandas不熟,正在学习,惭愧
【隔壁😼山楂】:主要你这用了load_workbook开了又关,关了又开,pandas读了个表又不使用读取的结果,有点费解
【小马哥】:我其实想实现的功能很简单:
- 首先判断excel第一列是Y,才接着往下判断;不是Y的不用处理
- 在满足1的前提下,找该行的claimno= DB2482742,而且医院编码='P000000491的这一行,在这一行的testresult里写入一个字符串test3awertwtrwelbert 就可以了 @隔壁😼山楂 哥,要不你给我写个简单的吧,我学习学习,如果能帮我找找这个问题在哪里那就更好了
【瑜亮老师】:其实就是满足Execute=="Y" & ClaimNo=="DB2482742" & P000000491=="P000000491"的TestResult列赋值为字符串test3awertwtrwelbert
【小马哥】:恩,对对,其中Execute=="Y"是个大前提
【瑜亮老师】:mask = (df['Execute'] == "Y") & (df['ClaimNo'] == "DB2482742") & (df['P000000491'] == "P000000491") df.loc[mask, 'TestResult'] = "test3awertwtrwelbert"
【小马哥】:这是个好办法,我这个excel有很多列,我想写的灵活点,这次用的条件是ClaimNo和医院编码,我下次可能用别的列,下次我可能用4列甚至更多的列去相互比较,因为我数据多行的情况下 ,有可能重复性很高,所以只能写更多的列去筛选出唯一一行。
所以我传入的参数用了**kwargs
【瑜亮老师】:mask = (df['Execute'] == "Y") & (df['ClaimNo'] == "DB2482742") & (df['医院编码']="P000000491") df.loc[mask, 'TestResult'] = "test3awertwtrwelbert"
【小马哥】:恩,我下次如果换了查询条件的话,那这个代码是不是又要改,有没没有什么洗发可以以后都别改的那种
【瑜亮老师】:写成自定义函数,字典传参就行了。思路还是上面的这两行代码,只是要做一点点变化
【隔壁😼山楂】:
from os.path import dirname, abspath
import pandas as pd
def writeExcel_v2(filename, sheet_name, save_column_name, save_data, **kwargs):
df = pd.read_excel(io=filename, sheet_name=sheet_name)
res = df[df.reindex(columns=kwargs.keys()).isin(kwargs).all(axis=1)]
row_number = res.index + 2 # excel的行号和本方法的行号相差2
col_number = df.columns.get_indexer([save_column_name])[0] + 1
with pd.ExcelWriter(filename, engine='openpyxl', mode='a') as excel:
worksheet = excel.book[sheet_name]
for row in row_number:
worksheet.cell(row=row, column=col_number, value=save_data)
print(f"第{row}行 第{col_number}列的值会保存为:{save_data}")
filename = dirname(dirname(abspath(__file__))) + r'\ExcelTest.xlsx'
sheetname = "DB"
# kwargs = {'ClaimNo': ['DB2482742'], '医院编码': ['P000000491']}
kwargs = {'Execute': ['Y']}
writeExcel_v2(filename, sheetname, 'TestResult', 'test3awertwtrwelbert', **kwargs)
修改好了,只改查询条件的话是不用改代码的 【小马哥】:@隔壁😼山楂 @德善堂小儿推拿-瑜亮老师 谢谢两位老师,我先理解下
【隔壁😼山楂】:我的是把你代码里冗余部分去掉了,然后可以实现你的功能。读取及写入习惯还是沿用你发的代码。
【小马哥】: 嗯嗯,正在努力理解学习中。。。
顺利地解决了粉丝的问题。
如果你也有类似这种Python相关的小问题,欢迎随时来交流群学习交流哦,有问必答!
三、总结
大家好,我是Python进阶者。这篇文章主要盘点了一个Python自动化办公问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。
最后感谢粉丝【小马哥】提出的问题,感谢【隔壁😼山楂】、【瑜亮老师】给出的思路,感谢【莫生气】等人参与学习交流。
【提问补充】温馨提示,大家在群里提问的时候。可以注意下面几点:如果涉及到大文件数据,可以数据脱敏后,发点demo数据来(小文件的意思),然后贴点代码(可以复制的那种),记得发报错截图(截全)。代码不多的话,直接发代码文字即可,代码超过50行这样的话,发个.py文件就行。