一、进程的相关概念
1.1 定义
进程用来描述一个程序及其执行过程中的信息,即描述一个执行中的程序, 所以才将其命名为进程,即进行中的程序,也可以说进程是程序的一次执行。
1.2 进程的状态
操作系统中的进程状态主要包括∶运行态—— 当前占有CPU、正在执行的进程状态;就绪态——一个进程具备了所有可以执行的条件,只要获得 CPU 就能开始执行;阻塞态 —— 也称睡眠态或等待态,是指一个进程因为缺少某 些条件,即使分配了CPU也无法执行的状态。有了这三个状态,就相应地产生了三个 PCB队列∶ 运行队列、就绪队列和阻塞队列。
1.3 进程的两个基本属性
- 进程是一个可拥有资源的独立单位,一个进程要能独立运行,它必须已拥有一定的资源。
- 进程同时又是一个可独立调度和分派的基本单位。
1.4 线程的引出
- 简单的来说,进程=资源+指令序列
- 程序并发执行需要付出巨大的时空开销:如创建进程(分配所必须的除处理机以外的所有资源、如内存空间、IO设备、PCB等)、撤销进程、切换进程等。由此引出了线程,线程的作用是保留并发的优点同时避免进程的切换,避免过大的系统开销。
1.5 进程和线程有什么区别?
进程其实就是进行中的程序,或者说是程序的一次执行,用来描述一个程序及其执行过程中的信息,是一个动态概念,竞争计算机系统资源的基本单位。传统的进程有两个基本属性,分别是可拥有资源的独立单位、可独立调度和分派的基本单位(简单来说就是资源+多个指令序列)。但是进程的创建、切换和销毁需要付出巨大的代价,因此可以采用分治的思想,将这两个基本属性分开,由OS处理,把线程作为调度和分派的基本单位,这样,就能够做到轻装上阵,而对于拥有资源的基本单位--进程,有不对之施加频繁的切换,而线程又是比较轻量级的,线程切换付出的代价不大,这样就能够大大提高CPU的执行效率。
线程,很多人说是一个程序里不同的执行路径,但是更具体地说,线程就是进程中的一个执行序列,本质是代码段+栈,栈中存放着的就是执行到代码的位置,线程的切换,实质就是栈的切换。通过调用yield()释放CPU,释放CPU之前,先把线程的现场压入栈中,然后下一个TCB的栈中弹栈,弹出另一个线程指令的地址,止痒完成了线程的切换。 线程又可以分为用户级线程和核心级线程,用户级线程工作在用户态、核心级线程工作在内核态。一个进程中,可以有多个用户级线程,但是这些用户级线程对操作系统来说是不可见的,是完全透明的,对操作系统来说,只有进程和核心级线程是可见的,因此的话,如果某个进程中,某个用户级线程阻塞了,这个时候,操作系统将会阻塞住整个进程,因为用户级线程对操作系统透明,因此,操作系统无法将CPU资源分配给其他的用户级线程,就会造成整个进程的阻塞。 对于java语言来说,我们手动写的线程看起来应该是用户级的线程,但是,多线程的目的是为了提高并发,提高CPU的利用率,上述分析,一个用户级线程又有可能导致整个进程阻塞,这就跟我们的初衷提高CPU的利利用率是相矛盾的,因此,java的多线程不应该只是用户级线程,在一些支持多线程的系统中,java的每一个线程应该包括一个用户级线程和一个核心级线程,形成一对一的关系,这样某个线程阻塞后,操作系统能过对应的核心级线程就能感知到这个线程阻塞了,及时将CPU分配给另一个线程,这样的话,切换就能还是线程的切换,因此就能在实现并发的同时减少进程的切换,减少切换时的时空开销。而linux系统中,是没有进程这个概念的,但是linux的进程非常轻量级,可以每一个进程可以看成是轻量级的线程,因此也能在实现并发的同时,也能避免过大的系统开销。
1.6 线程之间共享哪些资源 ?
同一个进程之间的线程可以共享该进程的所有资源,表现为这些线程拥有相同的地址空间,可以访问地址空间中的每一个虚地址,除此之外,还包括已打开的文件、定时器、信号量机构等的内存空间以及进程申请到的IO设备。
1.7 线程私有的资源
TCB、程序计数器、局部变量、寄存器、线程自己的栈、线程ID等。
1.8 线程的通信方式
- wait/notify 等待
- Volatile 内存共享
- CountDownLatch 并发工具
- CyclicBarrier 并发工具
1.9 进程的通信方式
** 1、无名管道通信** 无名管道( pipe ):管道是一种半双工的通信方式,数据只能单向流动,而且只能在具有亲缘关系的进程间使用。进程的亲缘关系通常是指父子进程关系。 ** 2、高级管道通信** 高级管道(popen):将另一个程序当做一个新的进程在当前程序进程中启动,则它算是当前程序的子进程,这种方式我们成为高级管道方式。 ** 3、有名管道通信** 有名管道 (named pipe) : 有名管道也是半双工的通信方式,但是它允许无亲缘关系进程间的通信。 ** 4、消息队列通信** 消息队列( message queue ) : 消息队列是由消息的链表,存放在内核中并由消息队列标识符标识。消息队列克服了信号传递信息少、管道只能承载无格式字节流以及缓冲区大小受限等缺点。 ** 5、信号量通信** 信号量( semophore ) : 信号量是一个计数器,可以用来控制多个进程对共享资源的访问。它常作为一种锁机制,防止某进程正在访问共享资源时,其他进程也访问该资源。因此,主要作为进程间以及同一进程内不同线程之间的同步手段。 ** 6、信号** 信号 ( sinal ) : 信号是一种比较复杂的通信方式,用于通知接收进程某个事件已经发生。 ** 7、共享内存通信** 共享内存( shared memory ) :共享内存就是映射一段能被其他进程所访问的内存,这段共享内存由一个进程创建,但多个进程都可以访问。共享内存是最快的 IPC 方式,它是针对其他进程间通信方式运行效率低而专门设计的。它往往与其他通信机制,如信号两,配合使用,来实现进程间的同步和通信。 ** 8、套接字通信** 套接字( socket ) : 套接口也是一种进程间通信机制,与其他通信机制不同的是,它可用于不同机器间的进程通信。
二、死锁
2.1 死锁的定义?
在一组进程发生死锁的情况下,这组死锁进程中的每一个进程,都在等待另一个死锁进程所占有的资源。
2.2 产生死锁的条件?
2.2.1 互斥条件
进程要求对所分配的资源(如打印机)进行排他性控制,即在一段时间内某资源仅为一个进程所占有。此时若有其他进程请求该资源,则请求进程只能等待。
2.2.2 请求和保持条件
进程已经保持了至少一个资源,但又提出了新的资源请求,而该资源已被其他进程占有,此时请求进程被阻塞,但对自己已获得的资源保持不放。
2.2.3 不可抢占条件
进程所获得的资源在未使用完毕之前,不能被其他进程强行夺走,即只能由获得该资源的进程自己来释放(只能是主动释放)。
2.2.4 循环等待条件
存在一种进程资源的循环等待链,链中每一个进程已获得的资源同时被链中下一个进程所请求。即存在一个处于等待状态的进程集合{Pl, P2, …, pn},其中Pi等 待的资源被P(i+1)占有(i=0, 1, …, n-1),Pn等待的资源被P0占有。