一篇文章浅析Python自带的线程池和进程池

Irene181
• 阅读 2060

前言

大家好,我是星期八。

我们都知道,不管是Java,还是C++,还是Go,还是Python,都是有线程这个概念的。

但是我们知道,线程是不能随便创建的,就像每招一个员工一样,是有代价的,无限制招人肯定最后各种崩溃。

所以通常情况下,我们会引出线程池这个概念。

本质就是我就招了几个固定的员工,给他们派活,某一个人的活干完了再去任务中心领取新的活。

防止任务太多,一次性招太多工人,最后系统崩溃。

开心一刻

理想的多线程

一篇文章浅析Python自带的线程池和进程池

实际的多线程

一篇文章浅析Python自带的线程池和进程池

from concurrent.futures import ...


可能也是因为线程池这个东西用的越来越多了吧,从Python3.2+之后,就成了内置模块

对的,直接就能使用,不需要pip进行安装什么的。

concurrent.futures下面主要有俩接口。

  • ThreadPoolExecutor 线程池。

  • ProcessPoolExecutor进程池。

这里可没有什么所谓的异步池

个人看法:虽然异步的性能很高,但是目前除了Go以外,其他实现的都不是太好,用法上面有些怪异,当然,你们可以说我菜,我承认。

线程池

示例代码

`import time``from concurrent.futures import ThreadPoolExecutor``import random``# max_workers表示工人数量,也就是线程池里面的线程数量``pool = ThreadPoolExecutor(max_workers=10)``# 任务列表``task_list = ["任务1", "任务2", "任务3", "任务4", ]``def handler(task_name):` `# 随机睡眠,模仿任务执行时间不确定性` `n = random.randrange(5)` `time.sleep(n)` `print(f"任务内容:{task_name}")``if __name__ == '__main__':` `# 遍历任务,` `for task in task_list:` `"""` `交给函数处理,submit会将所有任务都提交到一个地方,不会阻塞` `然后线程池里面的每个线程会来取任务,` `比如:线程池有3个线程,但是有5个任务` `会先取走三个任务,每个线程去处理` `其中一个线程处理完自己的任务之后,会再来提交过的任务区再拿走一个任务` `"""` `pool.submit(handler, task)` `print("main执行完毕")`

执行结果

一篇文章浅析Python自带的线程池和进程池

发现的问题

其实这个就是并发的,不要怀疑,但是你有没有发现个问题,main先执行,这说明啥?

这说明,我main跑完之后,是不管子线程的死活的。

那能不能设置一下,所有的子线程都执行完之后main函数在执行完?

当然可以,需要一个参数即可。

pool.shutdown()

要完成上述的问题,我们需要一个参数,加上这个参数之后。

就可以让主线程等待所有子线程执行完之后,主线程再执行完

示例代码

`...``if __name__ == '__main__':` `# 遍历任务,` `for task in task_list:` `"""` `交给函数处理,submit会将所有任务都提交到一个地方` `然后线程池里面的每个线程会来取任务,` `比如:线程池有3个线程,但是有5个任务` `会先取走三个任务,每个线程去处理` `其中一个线程处理完自己的任务之后,会再来提交过的任务区再拿走一个任务` `"""` `pool.submit(handler, task)` `pool.shutdown()` `print("main执行完毕")`

主要就是13行的pool.shutdown()

执行结果

一篇文章浅析Python自带的线程池和进程池

这次结果就是我们想要的了,hhh!!!

add_done_callback

add_done_callback可以理解为是回调函数,线程执行完之后,会自动调用指定的回调函数。

并且能拿到线程执行函数的返回值

有什么用,我也没用过,怪我才疏学浅叭。

示例代码

`import time``from concurrent.futures import ThreadPoolExecutor``import random``from concurrent.futures._base import Future``# max_workers表示工人数量,也就是线程池里面的线程数量``pool = ThreadPoolExecutor(max_workers=10)``# 任务列表``task_list = ["任务1", "任务2", "任务3", "任务4", ]``def handler(task_name):` `# 随机睡眠,模仿任务执行时间不确定性` `n = random.randrange(5)` `time.sleep(n)` `print(f"任务内容:{task_name}")` `return f"任务内容:{task_name}"``def done(res: Future):` `print("done拿到的返回值:", res.result())``if __name__ == '__main__':` `# 遍历任务,` `for task in task_list:` `futrue = pool.submit(handler, task)  # type:Future` `futrue.add_done_callback(done)` `pool.shutdown()` `print("main执行完毕")`

注意:第17,27,28行代码!

执行效果

一篇文章浅析Python自带的线程池和进程池

我想,可能通常用在一些善后工作叭。

多进程方式

其实通过上述几个例子,我们基本是知道怎么使用上面这个线程池了。

但是都知道Python的线程,因为GIL(全局解释器锁)的原因,是不能并发到多个物理核心上的。

所以是IO密集型的,像爬虫,读写文件,使用线程池是ok的。

但是如果说我就是野,就是头铁,非要用Python做计算型应用,像图片压缩、视频流推送,那没办法,需要使用多进程池方式。

其实通过concurrent这个接口,可以很方便的创建进程池,只需要修改两个地方。

`...``# 改成导入进程池方式``from concurrent.futures import ProcessPoolExecutor``...``if __name__ == '__main__':` `...` `# 进程池方式` `pool = ProcessPoolExecutor(max_workers=10)` `...`

只需要修改这俩地方即可,其他和上述用法一摸一样。

总结

本篇主要讲的是Python自带的线程池进程池

比较有特色的是,ThreadPoolExecutorProcessPoolExecutor的接口是一样的。

只需要修改导入的包就行。

concurrent的接口主要有pool.submit(),pool.shutdown(),futrue.add_done_callback()

基本这几个都够自己用了。

如果在操作过程中有任何问题,记得下面留言,我们看到会第一时间解决问题。

想学习更多关于Python的知识,可以参考学习网址:http://pdcfighting.com/,点击阅读原文,可以直达噢~

**-----**------**-----**---**** End **-----**--------**-----**-****

往期精彩文章推荐:

一篇文章浅析Python自带的线程池和进程池

欢迎各位大佬点击链接加入群聊【helloworld开发者社区】:https://jq.qq.com/?_wv=1027&k=mBlk6nzX进群交流IT技术热点。

本文转自 https://mp.weixin.qq.com/s/hhhXQeTdB_uAULQPU6pFFA,如有侵权,请联系删除。

点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Jacquelyn38 Jacquelyn38
3年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
Karen110 Karen110
3年前
​一篇文章总结一下Python库中关于时间的常见操作
前言本次来总结一下关于Python时间的相关操作,有一个有趣的问题。如果你的业务用不到时间相关的操作,你的业务基本上会一直用不到。但是如果你的业务一旦用到了时间操作,你就会发现,淦,到处都是时间操作。。。所以思来想去,还是总结一下吧,本次会采用类型注解方式。time包importtime时间戳从1970年1月1日00:00:00标准时区诞生到现在
Stella981 Stella981
3年前
Python3:sqlalchemy对mysql数据库操作,非sql语句
Python3:sqlalchemy对mysql数据库操作,非sql语句python3authorlizmdatetime2018020110:00:00coding:utf8'''
Stella981 Stella981
3年前
Python之time模块的时间戳、时间字符串格式化与转换
Python处理时间和时间戳的内置模块就有time,和datetime两个,本文先说time模块。关于时间戳的几个概念时间戳,根据1970年1月1日00:00:00开始按秒计算的偏移量。时间元组(struct_time),包含9个元素。 time.struct_time(tm_y
Easter79 Easter79
3年前
Twitter的分布式自增ID算法snowflake (Java版)
概述分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的。有些时候我们希望能使用一种简单一些的ID,并且希望ID能够按照时间有序生成。而twitter的snowflake解决了这种需求,最初Twitter把存储系统从MySQL迁移
Stella981 Stella981
3年前
Noark入门之线程模型
0x00单线程多进程单线程与单进程多线程的目的都是想尽可能的利用CPU,减少CPU的空闲时间,特别是多核环境,今天咱不做深度解读,跳过...0x01线程池锁最早的一部分游戏服务器是采用线程池的方式来处理玩家的业务请求,以达最大限度的利用多核优势来提高处理业务能力。但线程池同时也带来了并发问题,为了解决同一玩家多个业务请求不被
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
10个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这