30 个 Python 的最佳实践、小贴士和技巧!

Stella981
• 阅读 659

点击关注上方“杰哥的IT之旅”,

后台回复“ Python自动化 ”获取精心整理的PDF。

作者 | Erik-Jan van Baaren

译者 | 弯月,责编 | 屠敏

出品 | CSDN(ID:CSDNnews)

以下为译文:

元旦过完了,我们都纷纷回到了各自的工作岗位。新的一年新气象,我想借本文为大家献上 Python 语言的30个最佳实践、小贴士和技巧,希望能对各位勤劳的程序员有所帮助,并希望大家工作顺利!

1. Python 版本

在此想提醒各位:自2020年1月1日起,Python 官方不再支持 Python 2。本文中的很多示例只能在 Python 3 中运行。如果你仍在使用 Python 2.7,请立即升级。

2. 检查 Python 的最低版本

你可以在代码中检查 Python 的版本,以确保你的用户没有在不兼容的版本中运行脚本。检查方式如下:

     if not sys.version_info > (2, 7):   # berate your user for running a 10 year   # python versionelif not sys.version_info >= (3, 5):   # Kindly tell your user (s)he needs to upgrade   # because you're using 3.5 features
   
     

    
    
    

3. IPython

30 个 Python 的最佳实践、小贴士和技巧!

IPython 本质上就是一个增强版的shell。就冲着自动补齐就值得一试,而且它的功能还不止于此,它还有很多令我爱不释手的命令,例如:

  • %cd:改变当前的工作目录

  • %edit:打开编辑器,并关闭编辑器后执行键入的代码

  • %env:显示当前环境变量

  • %pip install [pkgs]:无需离开交互式shell,就可以安装软件包

  • %time 和 %timeit:测量执行Python代码的时间

完整的命令列表,请点击此处查看(https://ipython.readthedocs.io/en/stable/interactive/magics.html)。

还有一个非常实用的功能:引用上一个命令的输出。In 和 Out 是实际的对象。你可以通过 Out[3] 的形式使用第三个命令的输出。

IPython 的安装命令如下:

     pip3 install ipython
   
     

    
    
    

4. 列表推导式

你可以利用列表推导式,避免使用循环填充列表时的繁琐。列表推导式的基本语法如下:

     [ expression for item in list if conditional ]
   
     

    
    
    

举一个基本的例子:用一组有序数字填充一个列表:

     mylist = [i for i in range(10)]print(mylist)# [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
   
     

    
    
    

由于可以使用表达式,所以你也可以做一些算术运算:

     squares = [x**2 for x in range(10)]print(squares)# [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
   
     

    
    
    

甚至可以调用外部函数:

     def some_function(a):    return (a + 5) / 2my_formula = [some_function(i) for i in range(10)]print(my_formula)# [2, 3, 3, 4, 4, 5, 5, 6, 6, 7]
   
     

    
    
    

最后,你还可以使用 ‘if’ 来过滤列表。在如下示例中,我们只保留能被2整除的数字:

     filtered = [i for i in range(20) if i%2==0]print(filtered)# [0, 2, 4, 6, 8, 10, 12, 14, 16, 18]
   
     

    
    
    

5. 检查对象使用内存的状况

你可以利用 sys.getsizeof() 来检查对象使用内存的状况:

     import sysmylist = range(0, 10000)print(sys.getsizeof(mylist))# 48
   
     

    
    
    

等等,为什么这个巨大的列表仅包含48个字节?

因为这里的 range 函数返回了一个类,只不过它的行为就像一个列表。在使用内存方面,range 远比实际的数字列表更加高效。

你可以试试看使用列表推导式创建一个范围相同的数字列表:

     import sysmyreallist = [x for x in range(0, 10000)]print(sys.getsizeof(myreallist))# 87632
   
     

    
    
    

6. 返回多个值

Python 中的函数可以返回一个以上的变量,而且还无需使用字典、列表或类。如下所示:

     def get_user(id):    # fetch user from database    # ....    return name, birthdatename, birthdate = get_user(4)
   
     

    
    
    

如果返回值的数量有限当然没问题。但是,如果返回值的数量超过3个,那么你就应该将返回值放入一个(数据)类中。

7. 使用数据类

Python从版本3.7开始提供数据类。与常规类或其他方法(比如返回多个值或字典)相比,数据类有几个明显的优势:

  • 数据类的代码量较少

  • 你可以比较数据类,因为数据类提供了 __eq__ 方法

  • 调试的时候,你可以轻松地输出数据类,因为数据类还提供了 __repr__ 方法

  • 数据类需要类型提示,因此可以减少Bug的发生几率

数据类的示例如下:

     from dataclasses import dataclass@dataclassclass Card:    rank: str    suit: strcard = Card("Q", "hearts")print(card == card)# Trueprint(card.rank)# 'Q'print(card)Card(rank='Q', suit='hearts')
   
     

    
    
    

详细的使用指南请点击这里(https://realpython.com/python-data-classes/)。

8. 交换变量

如下的小技巧很巧妙,可以为你节省多行代码:

     a = 1b = 2a, b = b, aprint (a)# 2print (b)# 1
   
     

    
    
    

9. 合并字典(Python 3.5以上的版本)

从Python 3.5开始,合并字典的操作更加简单了:

     dict1 = { 'a': 1, 'b': 2 }dict2 = { 'b': 3, 'c': 4 }merged = { **dict1, **dict2 }print (merged)# {'a': 1, 'b': 3, 'c': 4}
   
     

    
    
    

如果 key 重复,那么第一个字典中的 key 会被覆盖。

10. 字符串的首字母大写

如下技巧真是一个小可爱:

     mystring = "10 awesome python tricks"print(mystring.title())'10 Awesome Python Tricks'
   
     

    
    
    

11. 将字符串分割成列表

你可以将字符串分割成一个字符串列表。在如下示例中,我们利用空格分割各个单词:

     mystring = "The quick brown fox"mylist = mystring.split(' ')print(mylist)# ['The', 'quick', 'brown', 'fox']
   
     

    
    
    

12. 根据字符串列表创建字符串

与上述技巧相反,我们可以根据字符串列表创建字符串,然后在各个单词之间加入空格:

     mylist = ['The', 'quick', 'brown', 'fox']mystring = " ".join(mylist)print(mystring)# 'The quick brown fox'
   
     

    
    
    

你可能会问为什么不是 mylist.join(" "),这是个好问题!

根本原因在于,函数 String.join() 不仅可以联接列表,而且还可以联接任何可迭代对象。将其放在String中是为了避免在多个地方重复实现同一个功能。

13. 表情符

30 个 Python 的最佳实践、小贴士和技巧!

有些人非常喜欢表情符,而有些人则深恶痛绝。我在此郑重声明:在分析社交媒体数据时,表情符可以派上大用场。

首先,我们来安装表情符模块:

     pip3 install emoji
   
     

    
    
    

安装完成后,你可以按照如下方式使用:

     import emojiresult = emoji.emojize('Python is :thumbs_up:')print(result)# 'Python is 👍'# You can also reverse this:result = emoji.demojize('Python is 👍')print(result)# 'Python is :thumbs_up:'
   
     

    
    
    

更多有关表情符的示例和文档,请点击此处(https://pypi.org/project/emoji/)。

14. 列表切片

列表切片的基本语法如下:

     a[start:stop:step]
   
     

    
    
    

start、stop 和 step 都是可选项。如果不指定,则会使用如下默认值:

  • start:0

  • end:字符串的结尾

  • step:1

示例如下:

     # We can easily create a new list from # the first two elements of a list:first_two = [1, 2, 3, 4, 5][0:2]print(first_two)# [1, 2]# And if we use a step value of 2, # we can skip over every second number# like this:steps = [1, 2, 3, 4, 5][0:5:2]print(steps)# [1, 3, 5]# This works on strings too. In Python,# you can treat a string like a list of# letters:mystring = "abcdefdn nimt"[::2]print(mystring)# 'aced it'
   
     

    
    
    

15. 反转字符串和列表

你可以利用如上切片的方法来反转字符串或列表。只需指定 step 为 -1,就可以反转其中的元素:

     revstring = "abcdefg"[::-1]print(revstring)# 'gfedcba'revarray = [1, 2, 3, 4, 5][::-1]print(revarray)# [5, 4, 3, 2, 1]
   
     

    
    
    

16. 显示猫猫

我终于找到了一个充分的借口可以在我的文章中显示猫猫了,哈哈!当然,你也可以利用它来显示图片。首先你需要安装 Pillow,这是一个 Python 图片库的分支:

     pip3 install Pillow
   
     

    
    
    

接下来,你可以将如下图片下载到一个名叫 kittens.jpg 的文件中:

30 个 Python 的最佳实践、小贴士和技巧!

然后,你就可以通过如下 Python 代码显示上面的图片:

     from PIL import Imageim = Image.open("kittens.jpg")im.show()print(im.format, im.size, im.mode)# JPEG (1920, 1357) RGB
   
     

    
    
    

Pillow 还有很多显示该图片之外的功能。它可以分析、调整大小、过滤、增强、变形等等。完整的文档,请点击这里(https://pillow.readthedocs.io/en/stable/)。

17. map()

Python 有一个自带的函数叫做 map(),语法如下:

     map(function, something_iterable)
   
     

    
    
    

所以,你需要指定一个函数来执行,或者一些东西来执行。任何可迭代对象都可以。在如下示例中,我指定了一个列表:

     def upper(s):    return s.upper()mylist = list(map(upper, ['sentence', 'fragment']))print(mylist)# ['SENTENCE', 'FRAGMENT']# Convert a string representation of# a number into a list of ints.list_of_ints = list(map(int, "1234567")))print(list_of_ints)# [1, 2, 3, 4, 5, 6, 7]
   
     

    
    
    

你可以仔细看看自己的代码,看看能不能用 map() 替代某处的循环。

18. 获取列表或字符串中的唯一元素

如果你利用函数 set() 创建一个集合,就可以获取某个列表或类似于列表的对象的唯一元素:

     mylist = [1, 1, 2, 3, 4, 5, 5, 5, 6, 6]print (set(mylist))# {1, 2, 3, 4, 5, 6}# And since a string can be treated like a # list of letters, you can also get the # unique letters from a string this way:print (set("aaabbbcccdddeeefff"))# {'a', 'b', 'c', 'd', 'e', 'f'}
   
     

    
    
    

19. 查找出现频率最高的值

你可以通过如下方法查找出现频率最高的值:

     test = [1, 2, 3, 4, 2, 2, 3, 1, 4, 4, 4]print(max(set(test), key = test.count))# 4
   
     

    
    
    

你能看懂上述代码吗?想法搞明白上述代码再往下读。

没看懂?我来告诉你吧:

  • max() 会返回列表的最大值。参数 key 会接受一个参数函数来自定义排序,在本例中为 test.count。该函数会应用于迭代对象的每一项。

  • test.count 是 list 的内置函数。它接受一个参数,而且还会计算该参数的出现次数。因此,test.count(1) 将返回2,而 test.count(4) 将返回4。

  • set(test) 将返回 test 中所有的唯一值,也就是 {1, 2, 3, 4}。

因此,这一行代码完成的操作是:首先获取 test 所有的唯一值,即{1, 2, 3, 4};然后,max 会针对每一个值执行 list.count,并返回最大值。

这一行代码可不是我个人的发明。

20. 创建一个进度条

你可以创建自己的进度条,听起来很有意思。但是,更简单的方法是使用 progress 包:

     pip3 install progress
   
     

    
    
    

接下来,你就可以轻松地创建进度条了:

     from progress.bar import Barbar = Bar('Processing', max=20)for i in range(20):    # Do some work    bar.next()bar.finish()
   
     

    
    
    

21. 在交互式shell中使用_(下划线运算符)

你可以通过下划线运算符获取上一个表达式的结果,例如在 IPython 中,你可以这样操作:

     In [1]: 3 * 3Out[1]: 9In [2]: _ + 3Out[2]: 12
   
     

    
    
    

Python Shell 中也可以这样使用。另外,在 IPython shell 中,你还可以通过 Out[n] 获取表达式 In[n] 的值。例如,在如上示例中,Out[1] 将返回数字9。

22. 快速创建Web服务器

你可以快速启动一个Web服务,并提供当前目录的内容:

     python3 -m http.server
   
     

    
    
    

当你想与同事共享某个文件,或测试某个简单的HTML网站时,就可以考虑这个方法。

23. 多行字符串

虽然你可以用三重引号将代码中的多行字符串括起来,但是这种做法并不理想。所有放在三重引号之间的内容都会成为字符串,包括代码的格式,如下所示。

我更喜欢另一种方法,这种方法不仅可以将多行字符串连接在一起,而且还可以保证代码的整洁。唯一的缺点是你需要明确指定换行符。

     s1 = """Multi line strings can be put        between triple quotes. It's not ideal        when formatting your code though"""print (s1)# Multi line strings can be put#         between triple quotes. It's not ideal#         when formatting your code thoughs2 = ("You can also concatenate multiple\n" +        "strings this way, but you'll have to\n"        "explicitly put in the newlines")print(s2)# You can also concatenate multiple# strings this way, but you'll have to# explicitly put in the newlines
   
     

    
    
    

24. 条件赋值中的三元运算符

这种方法可以让代码更简洁,同时又可以保证代码的可读性:

     [on_true] if [expression] else [on_false]
   
     

    
    
    

示例如下:

     x = "Success!" if (y == 2) else "Failed!"
   
     

    
    
    

25. 统计元素的出现次数

你可以使用集合库中的 Counter 来获取列表中所有唯一元素的出现次数,Counter 会返回一个字典:

     from collections import Countermylist = [1, 1, 2, 3, 4, 5, 5, 5, 6, 6]c = Counter(mylist)print(c)# Counter({1: 2, 2: 1, 3: 1, 4: 1, 5: 3, 6: 2})# And it works on strings too:print(Counter("aaaaabbbbbccccc"))# Counter({'a': 5, 'b': 5, 'c': 5})
   
     

    
    
    

26. 比较运算符的链接

你可以在 Python 中将多个比较运算符链接到一起,如此就可以创建更易读、更简洁的代码:

     x = 10# Instead of:if x > 5 and x < 15:    print("Yes")# yes# You can also write:if 5 < x < 15:    print("Yes")# Yes
   
     

    
    
    

27. 添加颜色

30 个 Python 的最佳实践、小贴士和技巧!

你可以通过 Colorama,设置终端的显示颜色:

     from colorama import Fore, Back, Styleprint(Fore.RED + 'some red text')print(Back.GREEN + 'and with a green background')print(Style.DIM + 'and in dim text')print(Style.RESET_ALL)print('back to normal now')
   
     

    
    
    

28. 日期的处理

python-dateutil 模块作为标准日期模块的补充,提供了非常强大的扩展,你可以通过如下命令安装:

     pip3 install python-dateutil 
   
     

    
    
    

你可以利用该库完成很多神奇的操作。在此我只举一个例子:模糊分析日志文件中的日期:

     from dateutil.parser import parselogline = 'INFO 2020-01-01T00:00:01 Happy new year, human.'timestamp = parse(log_line, fuzzy=True)print(timestamp)# 2020-01-01 00:00:01
   
     

    
    
    

你只需记住:当遇到常规 Python 日期时间功能无法解决的问题时,就可以考虑 python-dateutil !

29.整数除法

30 个 Python 的最佳实践、小贴士和技巧!

在 Python 2 中,除法运算符(/)默认为整数除法,除非其中一个操作数是浮点数。因此,你可以这么写:

     # Python 25 / 2 = 25 / 2.0 = 2.5
   
     

    
    
    

在 Python 3 中,除法运算符(/)默认为浮点除法,而整数除法的运算符为 //。因此,你需要这么写:

     Python 35 / 2 = 2.55 // 2 = 2
   
     

    
    
    

这项变更背后的动机,请参阅 PEP-0238(https://www.python.org/dev/peps/pep-0238/)。

30. 通过chardet 来检测字符集

你可以使用 chardet 模块来检测文件的字符集。在分析大量随机文本时,这个模块十分实用。安装方法如下:

     pip install chardet
   
     

    
    
    

安装完成后,你就可以使用命令行工具 chardetect 了,使用方法如下:

     chardetect somefile.txtsomefile.txt: ascii with confidence 1.0
   
     

    
    
    

你也可以在编程中使用该库,完整的文档请点击这里(https://chardet.readthedocs.io/en/latest/usage.html)。

这30个小例子虽然有一些是老生长谈,但是确实非常经典,值得反复记忆和练习,尤其是第28个例子,非常实用,小编学习Python多年依然觉得这个很给力,值得收藏!

原文:

https://towardsdatascience.com/30-python-best-practices-tips-and-tricks-caefb9f8c5f5

- End -

本公众号全部博文已整理成一个目录,请在公众号后台回复「 m 」获取!

推荐阅读:

1、 我花了一周的时间,就为了整理这份 97 页的 Python 自动化系列文档。【附获取方式】
2、 我精心整理的 136 页 Excel 数据透视表 PDF 文件!【附获取方式】
3、 利用 Python 爬取了 13966 条运维招聘信息,我得出了哪些结论?
4、 适合 Python 入门的 8 款强大工具!
5、 23个 Python 爬虫开源项目代码:爬取微信、淘宝、豆瓣、知乎、微博等
6、 专辑 | Python与数据分析

            关注微信公众号『 
           杰哥的IT之旅』,后台回复“ 
           1024”查看更多内容,回复“ 
           微信”添加我微信。 
           
           
            
           
           
            
           
           
            
             
              
               
                
                 
                  
                   
                    
                    好文和朋友一起看~ 
                    
                   
                  
                 
                
               
              
             
            
           
          
        
      
        
   
       
       
       
     
       
  
      
      
      
    
      
 
     
     
     
   
     

    
    
    

本文分享自微信公众号 - 杰哥的IT之旅(Jake_Internet)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
待兔 待兔
5个月前
手写Java HashMap源码
HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程22
Wesley13 Wesley13
3年前
SSH 证书登录教程
点击关注上方“杰哥的IT之旅”,后台回复“Python自动化(https://www.oschina.net/action/GoToLink?urlhttps%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzAwMjg1NjY3Nw%3D%3D%26mid%3D2247491317%26id
Wesley13 Wesley13
3年前
25 个实用网站工具推荐!
点击关注上方“杰哥的IT之旅”,后台回复“Python自动化(https://www.oschina.net/action/GoToLink?urlhttps%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzAwMjg1NjY3Nw%3D%3D%26mid%3D2247491317%26id
Wesley13 Wesley13
3年前
VS Code 的 7 个开源替代品!
点击关注上方“杰哥的IT之旅”,后台回复“Python自动化(https://www.oschina.net/action/GoToLink?urlhttps%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzAwMjg1NjY3Nw%3D%3D%26mid%3D2247491317%26id
Stella981 Stella981
3年前
Docker 入门终极指南:边学边用
点击关注上方“杰哥的IT之旅”,后台回复“Python自动化(https://www.oschina.net/action/GoToLink?urlhttps%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzAwMjg1NjY3Nw%3D%3D%26mid%3D2247491317%26id
Wesley13 Wesley13
3年前
2020年8月程序员工资统计,平均14401元,下跌势头止住了!
点击关注上方“杰哥的IT之旅”,后台回复“Python自动化(https://www.oschina.net/action/GoToLink?urlhttps%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzAwMjg1NjY3Nw%3D%3D%26mid%3D2247491317%26id
Stella981 Stella981
3年前
GitHub 数据告诉你:最幸福的码农在用什么编程语言?
点击关注上方“杰哥的IT之旅”,后台回复“Python自动化(https://www.oschina.net/action/GoToLink?urlhttps%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzAwMjg1NjY3Nw%3D%3D%26mid%3D2247491317%26id
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
11个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这