一篇文章带你深度解析Python线程和进程

作者&投稿:主父廖 (若有异议请与网页底部的电邮联系)
~

使用Python中的线程模块,能够同时运行程序的不同部分,并简化设计。如果你已经入门Python,并且想用线程来提升程序运行速度的话,希望这篇教程会对你有所帮助。

线程与进程

什么是进程

进程是系统进行资源分配和调度的一个独立单位 进程是具有一定独立功能的程序关于某个数据集合上的一次运行活动,进程是系统进行资源分配和调度的一个独立单位。每个进程都有自己的独立内存空间,不同进程通过进程间通信来通信。由于进程比较重量,占据独立的内存,所以上下文进程间的切换开销(栈、寄存器、虚拟内存、文件句柄等)比较大,但相对比较稳定安全。

什么是线程

CPU调度和分派的基本单位 线程是进程的一个实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位.线程自己基本上不拥有系统资源,只拥有一点在运行中必不可少的资源(如程序计数器,一组寄存器和栈),但是它可与同属一个进程的其他的线程共享进程所拥有的全部资源。线程间通信主要通过共享内存,上下文切换很快,资源开销较少,但相比进程不够稳定容易丢失数据。

进程与线程的关系图

线程与进程的区别:

进程

现实生活中,有很多的场景中的事情是同时进行的,比如开车的时候 手和脚共同来驾驶 汽车 ,比如唱歌跳舞也是同时进行的,再比如边吃饭边打电话;试想如果我们吃饭的时候有一个领导来电,我们肯定是立刻就接听了。但是如果你吃完饭再接听或者回电话,很可能会被开除。

注意:

多任务的概念

什么叫 多任务 呢?简单地说,就是操作系统可以同时运行多个任务。打个比方,你一边在用浏览器上网,一边在听MP3,一边在用Word赶作业,这就是多任务,至少同时有3个任务正在运行。还有很多任务悄悄地在后台同时运行着,只是桌面上没有显示而已。

现在,多核CPU已经非常普及了,但是,即使过去的单核CPU,也可以执行多任务。由于CPU执行代码都是顺序执行的,那么,单核CPU是怎么执行多任务的呢?

答案就是操作系统轮流让各个任务交替执行,任务1执行0.01秒,切换到任务2,任务2执行0.01秒,再切换到任务3,执行0.01秒,这样反复执行下去。表面上看,每个任务都是交替执行的,但是,由于CPU的执行速度实在是太快了,我们感觉就像所有任务都在同时执行一样。

真正的并行执行多任务只能在多核CPU上实现,但是,由于任务数量远远多于CPU的核心数量,所以,操作系统也会自动把很多任务轮流调度到每个核心上执行。 其实就是CPU执行速度太快啦!以至于我们感受不到在轮流调度。

并行与并发

并行(Parallelism)

并行:指两个或两个以上事件(或线程)在同一时刻发生,是真正意义上的不同事件或线程在同一时刻,在不同CPU资源呢上(多核),同时执行。

特点

并发(Concurrency)

指一个物理CPU(也可以多个物理CPU) 在若干道程序(或线程)之间多路复用,并发性是对有限物理资源强制行使多用户共享以提高效率。

特点

multiprocess.Process模块

process模块是一个创建进程的模块,借助这个模块,就可以完成进程的创建。

语法:Process([group [, target [, name [, args [, kwargs]]]]])

由该类实例化得到的对象,表示一个子进程中的任务(尚未启动)。

注意:1. 必须使用关键字方式来指定参数;2. args指定的为传给target函数的位置参数,是一个元祖形式,必须有逗号。

参数介绍:

group:参数未使用,默认值为None。

target:表示调用对象,即子进程要执行的任务。

args:表示调用的位置参数元祖。

kwargs:表示调用对象的字典。如kwargs = {'name':Jack, 'age':18}。

name:子进程名称。

代码:

除了上面这些开启进程的方法之外,还有一种以继承Process的方式开启进程的方式:

通过上面的研究,我们千方百计实现了程序的异步,让多个任务可以同时在几个进程中并发处理,他们之间的运行没有顺序,一旦开启也不受我们控制。尽管并发编程让我们能更加充分的利用IO资源,但是也给我们带来了新的问题。

当多个进程使用同一份数据资源的时候,就会引发数据安全或顺序混乱问题,我们可以考虑加锁,我们以模拟抢票为例,来看看数据安全的重要性。

加锁可以保证多个进程修改同一块数据时,同一时间只能有一个任务可以进行修改,即串行的修改。加锁牺牲了速度,但是却保证了数据的安全。

因此我们最好找寻一种解决方案能够兼顾:1、效率高(多个进程共享一块内存的数据)2、帮我们处理好锁问题。

mutiprocessing模块为我们提供的基于消息的IPC通信机制:队列和管道。队列和管道都是将数据存放于内存中 队列又是基于(管道+锁)实现的,可以让我们从复杂的锁问题中解脱出来, 我们应该尽量避免使用共享数据,尽可能使用消息传递和队列,避免处理复杂的同步和锁问题,而且在进程数目增多时,往往可以获得更好的可获展性( 后续扩展该内容 )。

线程

Python的threading模块

Python 供了几个用于多线程编程的模块,包括 thread, threading 和 Queue 等。thread 和 threading 模块允许程序员创建和管理线程。thread 模块 供了基本的线程和锁的支持,而 threading 供了更高级别,功能更强的线程管理的功能。Queue 模块允许用户创建一个可以用于多个线程之间 共享数据的队列数据结构。

python创建和执行线程

创建线程代码

1. 创建方法一:

2. 创建方法二:

进程和线程都是实现多任务的一种方式,例如:在同一台计算机上能同时运行多个QQ(进程),一个QQ可以打开多个聊天窗口(线程)。资源共享:进程不能共享资源,而线程共享所在进程的地址空间和其他资源,同时,线程有自己的栈和栈指针。所以在一个进程内的所有线程共享全局变量,但多线程对全局变量的更改会导致变量值得混乱。

代码演示:

得到的结果是:

首先需要明确的一点是GIL并不是Python的特性,它是在实现Python解析器(CPython)时所引入的一个概念。就好比C++是一套语言(语法)标准,但是可以用不同的编译器来编译成可执行代码。同样一段代码可以通过CPython,PyPy,Psyco等不同的Python执行环境来执行(其中的JPython就没有GIL)。

那么CPython实现中的GIL又是什么呢?GIL全称Global Interpreter Lock为了避免误导,我们还是来看一下官方给出的解释:

主要意思为:

因此,解释器实际上被一个全局解释器锁保护着,它确保任何时候都只有一个Python线程执行。在多线程环境中,Python 虚拟机按以下方式执行:

由于GIL的存在,Python的多线程不能称之为严格的多线程。因为 多线程下每个线程在执行的过程中都需要先获取GIL,保证同一时刻只有一个线程在运行。

由于GIL的存在,即使是多线程,事实上同一时刻只能保证一个线程在运行, 既然这样多线程的运行效率不就和单线程一样了吗,那为什么还要使用多线程呢?

由于以前的电脑基本都是单核CPU,多线程和单线程几乎看不出差别,可是由于计算机的迅速发展,现在的电脑几乎都是多核CPU了,最少也是两个核心数的,这时差别就出来了:通过之前的案例我们已经知道,即使在多核CPU中,多线程同一时刻也只有一个线程在运行,这样不仅不能利用多核CPU的优势,反而由于每个线程在多个CPU上是交替执行的,导致在不同CPU上切换时造成资源的浪费,反而会更慢。即原因是一个进程只存在一把gil锁,当在执行多个线程时,内部会争抢gil锁,这会造成当某一个线程没有抢到锁的时候会让cpu等待,进而不能合理利用多核cpu资源。

但是在使用多线程抓取网页内容时,遇到IO阻塞时,正在执行的线程会暂时释放GIL锁,这时其它线程会利用这个空隙时间,执行自己的代码,因此多线程抓取比单线程抓取性能要好,所以我们还是要使用多线程的。

GIL对多线程Python程序的影响

程序的性能受到计算密集型(CPU)的程序限制和I/O密集型的程序限制影响,那什么是计算密集型和I/O密集型程序呢?

计算密集型:要进行大量的数值计算,例如进行上亿的数字计算、计算圆周率、对视频进行高清解码等等。这种计算密集型任务虽然也可以用多任务完成,但是花费的主要时间在任务切换的时间,此时CPU执行任务的效率比较低。

IO密集型:涉及到网络请求(time.sleep())、磁盘IO的任务都是IO密集型任务,这类任务的特点是CPU消耗很少,任务的大部分时间都在等待IO操作完成(因为IO的速度远远低于CPU和内存的速度)。对于IO密集型任务,任务越多,CPU效率越高,但也有一个限度。

当然为了避免GIL对我们程序产生影响,我们也可以使用,线程锁。

Lock&RLock

常用的资源共享锁机制:有Lock、RLock、Semphore、Condition等,简单给大家分享下Lock和RLock。

Lock

特点就是执行速度慢,但是保证了数据的安全性

RLock

使用锁代码操作不当就会产生死锁的情况。

什么是死锁

死锁:当线程A持有独占锁a,并尝试去获取独占锁b的同时,线程B持有独占锁b,并尝试获取独占锁a的情况下,就会发生AB两个线程由于互相持有对方需要的锁,而发生的阻塞现象,我们称为死锁。即死锁是指多个进程因竞争资源而造成的一种僵局,若无外力作用,这些进程都将无法向前推进。

所以,在系统设计、进程调度等方面注意如何不让这四个必要条件成立,如何确定资源的合理分配算法,避免进程永久占据系统资源。

死锁代码

python线程间通信

如果各个线程之间各干各的,确实不需要通信,这样的代码也十分的简单。但这一般是不可能的,至少线程要和主线程进行通信,不然计算结果等内容无法取回。而实际情况中要复杂的多,多个线程间需要交换数据,才能得到正确的执行结果。

python中Queue是消息队列,提供线程间通信机制,python3中重名为为queue,queue模块块下提供了几个阻塞队列,这些队列主要用于实现线程通信。

在 queue 模块下主要提供了三个类,分别代表三种队列,它们的主要区别就在于进队列、出队列的不同。

简单代码演示

此时代码会阻塞,因为queue中内容已满,此时可以在第四个queue.put('苹果')后面添加timeout,则成为 queue.put('苹果',timeout=1)如果等待1秒钟仍然是满的就会抛出异常,可以捕获异常。

同理如果队列是空的,无法获取到内容默认也会阻塞,如果不阻塞可以使用queue.get_nowait()。

在掌握了 Queue 阻塞队列的特性之后,在下面程序中就可以利用 Queue 来实现线程通信了。

下面演示一个生产者和一个消费者,当然都可以多个

使用queue模块,可在线程间进行通信,并保证了线程安全。

协程

协程,又称微线程,纤程。英文名Coroutine。

协程是python个中另外一种实现多任务的方式,只不过比线程更小占用更小执行单元(理解为需要的资源)。为啥说它是一个执行单元,因为它自带CPU上下文。这样只要在合适的时机, 我们可以把一个协程 切换到另一个协程。只要这个过程中保存或恢复 CPU上下文那么程序还是可以运行的。

通俗的理解:在一个线程中的某个函数,可以在任何地方保存当前函数的一些临时变量等信息,然后切换到另外一个函数中执行,注意不是通过调用函数的方式做到的,并且切换的次数以及什么时候再切换到原来的函数都由开发者自己确定。

在实现多任务时,线程切换从系统层面远不止保存和恢复 CPU上下文这么简单。操作系统为了程序运行的高效性每个线程都有自己缓存Cache等等数据,操作系统还会帮你做这些数据的恢复操作。所以线程的切换非常耗性能。但是协程的切换只是单纯的操作CPU的上下文,所以一秒钟切换个上百万次系统都抗的住。

greenlet与gevent

为了更好使用协程来完成多任务,除了使用原生的yield完成模拟协程的工作,其实python还有的greenlet模块和gevent模块,使实现协程变的更加简单高效。

greenlet虽说实现了协程,但需要我们手工切换,太麻烦了,gevent是比greenlet更强大的并且能够自动切换任务的模块。

其原理是当一个greenlet遇到IO(指的是input output 输入输出,比如网络、文件操作等)操作时,比如访问网络,就自动切换到其他的greenlet,等到IO操作完成,再在适当的时候切换回来继续执行。

模拟耗时操作:

如果有耗时操作也可以换成,gevent中自己实现的模块,这时候就需要打补丁了。

使用协程完成一个简单的二手房信息的爬虫代码吧!

以下文章来源于Python专栏 ,作者宋宋

文章链接:https://mp.weixin.qq.com/s/2r3_ipU3HjdA5VnqSHjUnQ




一分钟看懂你的舌
探索身体健康的秘密指南:一分钟解读舌面世界<\/ 欢迎来到健康知识的探索之旅,这是健康一舟为您带来的第7篇深度解析文章。今天,让我们聚焦在身体的微观世界,通过一分钟的简明讲解,深入理解舌诊的奥秘,它是观察身体健康状况的重要窗口。舌头,生命的语言<\/ 舌头,这个看似普通的肌性器官,其实蕴含着丰富...

用一篇文章,带你了解12种常见的网页布局设计
遵循网页布局的最佳实践,能够带来全新的数字体验,灵活地调整不断变化的技术和设计趋势,进一步实现品牌目标。精彩推荐:1、聊聊卡片式设计的运用 2、案例分析:栅格系统的布局设计 3、如何设计深色模式?这3点因素需要考虑 4、深度解析:服务蓝图的应用逻辑 设计 ...

郁达夫《故都的秋》的全文及解析
有些批评家说,中国的文人学士,尤其是诗人,都带着很浓厚的颓废的色彩,所以中国的诗文里,赞颂秋的文字的特别的多。但外国的诗人,又何尝不然?我虽则外国诗文念的不多,也不想开出帐来,做一篇秋的诗歌散文钞,但你若去一翻英德法意等诗人的集子,或各国的诗文的Anthology来,总能够看到许多并于...

python能启动多少个线程?
导读:本篇文章首席CTO笔记来给大家介绍有关python能启动多少个线程的相关内容,希望对大家有所帮助,一起来看看吧。一篇文章带你深度解析Python线程和进程 使用Python中的线程模块,能够同时运行程序的不同部分,并简化设计。如果你已经入门Python,并且想用线程来提升程序运行速度的话,希望这篇教程会对你有所帮助。 线程与...

梁实秋:人性学
二、深度解析梁实秋,探讨梁氏思想形成的主要因素 梁实秋为什么看不到人的个性,也没有关注到文学的个性呢,其实关于这一点,很多人都有自己的看法。人们多是受鲁迅的影响对梁实秋有偏见,更用有色眼镜看他。就如你无心或者只是简单的想法,被扣上了大帽子和政治挂钩,那么这个人不论写的多好,有多爱国,都不能弥补他...

扁字怎么读?深度解析扁字的起源、音韵和使用
“扁”字,是一个常见的汉字,常常被人们用于书写、交流和传承。但是,你是否真的知道“扁”字是怎么读的呢?在这篇文章中,我们将深度解析扁字的起源、音韵和使用,为大家带来更多关于这个字的知识。一、扁字的产生和演变 据历史记录,扁字最早出现在商代的甲骨文中,当时它的形状与现在相比略有不...

教父深度解析(从维托·柯里昂到麦克的教父传承)
教父深度解析(从维托·柯里昂到麦克的教父传承)  我来答 1个回答 #热议# 你知道哪些00后职场硬刚事件?好声音1718 2022-08-22 · TA获得超过275个赞 知道答主 回答量:92 采纳率:0% 帮助的人:86.6万 我也去答题访问个人页 关注 展开全部 教父,在1972年上映,时至今日,仍旧是许多人心目中...

69 篇文章带你系统性的学习音视频开发(收藏起来假期看)
欢迎来到音视频开发的深度探索之旅,我们精心整理了69篇精华文章,从基础知识到实战经验,带你全面掌握这一领域的核心技术。让我们一起踏上这段系统学习的旅程吧!第一部分:深入理解基础 1. 声音篇: 从声音的本质出发,探讨声音的数学描述,包括采样、量化和编码,带你走进数字化音频的世界(1-10)。...

为什么有的大学生与大学所想的不一样?
这同样也是大学培养学生很重要的一个能力。总结:此问题内心的预期与所上大学不符,相信大家心里都会存在着难过。但放到人生的长度看,它只是你人生中的一次小小坎坷,要努力向上积极寻找调整方法。以上这篇文章带你深度解析了因素并且举例了众多方法,请牢记方法总比困难多。

兰陵王技能深度解析:技能特点与使用技巧一览!
同时使用大招进行输出和控制。如果敌方英雄比较分散或者有残血英雄,可以利用1技能进行远程消耗和收割。以上就是关于王者荣耀兰陵王技能介绍和玩法攻略的全部内容。希望这篇文章能够帮助你更好地了解和使用这个英雄。如果你有任何问题或想法,欢迎在评论区留言。

平坝县19785694090: 龙之谷手游拍卖行玩法深度解析一锤定音
人话鹿胎: 龙之谷手游拍卖行玩法深度解析 一锤定音 拍卖行,它的作用就是拍卖商品的.龙之谷中的拍卖行也同理,我们可在游戏中通过拍卖行购买到自己急需的装备和道具,下面...

平坝县19785694090: Python怎样使用解释器 -
人话鹿胎: 大学里计算机科学最吸引我的地方就是编译器.最神奇的是,编译器是如何读出我写的那些烂代码,并且还能生成那么复杂的程序.当我终于选了一门编译方面的课程时,我发现这个过程比我想的要简单得多. 在本系列的文章中,我会试着通过...

平坝县19785694090: python三本经典书籍都是什么? -
人话鹿胎: python三本经典书籍有:《深度学习入门:基于Python的理论与实现》,《Python高性能(第2版)》,《Python科学计算最佳实践:SciPy指南》. 1、《深度学习入门:基于Python的理论与实现》 本书深入浅出地剖析了深度学习的原理和相关...

平坝县19785694090: 2课1.上文中(就是初一语文第一课后面的一篇文章),作者以“你”称呼文学,作者样写好不好?请说说你的看法.2.P6上的悬字用的好不好?谈谈你的理解. -
人话鹿胎:[答案] 1.好,自然亲切,将文学拟人化,和文学对话,可增强文章的感染力. 2.好.形象的写出星星离“我”那样近,僦好像挂在半空,伸手可触.

平坝县19785694090: Python global 定义全局变量, 解析Python函数变量如何使用 -
人话鹿胎: 接下来,我们把值2赋给x.x是函数的局部变量.所以,当我们在函数内改变x的值的时候,在主块中定义的x不受影响.在最后一个print语句中,我们证明了主块中的x的值确实没有受到影响. 使用global语句 如果你想要为一个定义在函数外的变...

平坝县19785694090: 如何用Python分析一篇文章的关键词?有什么相关的库或算法? -
人话鹿胎: 应该用Python的正则表达式模块re 示例:#...import re with open('test.txt','r') as txt: f = txt.read() print re.match('正则表达式/关键词',f)#...具体可以多了解一下这个模块,查询有三种方法,一个是match匹配,也是比较常用的 然后还有search和findall 个人觉得这个人的正则表达式介绍文章还不错,推荐你参考:http://blog.csdn.net/theminority/article/details/7629227

平坝县19785694090: 如何评价《Python网络编程》 -
人话鹿胎: 你好,学习Python编程语言,是大家走入编程世界的最理想选择.无论是学习任何一门语言,基础知识,就是基础功非常的重要,找一个有丰富编程经验的老师或者师兄带着你会少走很多弯路, 你的进步速度也会快很多,无论我们学习的目的是什么,不得不说Python真的是一门值得你付出时间去学习的优秀编程语言.在选择培训时一定要多方面对比教学,师资,项目,就业等,慎重选择.

平坝县19785694090: 如何用python统计一篇英语文章里单词总数和句子总数 -
人话鹿胎: f=open("文章").read() n=0 for x in f.split(' '):n+=1for y in x.split('.'):n+=1for z in y.split('!'):n+=1for a in z.split('?'):n+=1 print n 没怎么想瞎写写,意思是以空格,句号,感叹号,问号等来分割!算出和来! 其他符号自己看看文章自己添加!分句子的话就把空格去掉,这样以句号,感叹号,问号分出来的应该是句子了!顺序不限的! 我是超级菜鸟,初学者者,高手见到这样的代码不要笑我!注意下编码!就行了!~

平坝县19785694090: 求《你 -- 的样子真美》作文一篇 -
人话鹿胎: 一、你专注的样子真美 秦芹大千世界,让你和我在这小小的一方土地里相遇,这是缘分.而遇见您,又是我的荣幸.你与我的遇见就是一次最好的安排.你专注的样子,真美.那专注的美陪伴了我近二十年. 韶华之年初遇你.依然清晰的记得...

平坝县19785694090: python怎么解析pcapng -
人话鹿胎: 你的python没有安装好..py文件没有被注册成正确的python关联.你选择“始终使用”这个选项吧. 感觉怪怪的.通常我们安装都会顺利. 另外python所在的目录一定要放到系统环境变量的path里

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网