CPU多级缓存
为什么需要CPU缓存?
原因是,CPU的频率太快了,快到主存跟不上,这样在处理器时钟周期内,CPU常常需要等待主存,浪费资源。所以cache的出现,是为了缓解CPU和内存之间速度的不匹配问题。
CPU缓存有什么意义?
- 时间局部性:如果某个数据被访问,那么在不久的将来它很有可能被再次访问。
- 空间局部性:如果某个数据被访问,那么与它相邻的数据很快也可能被访问。
CPU多级缓存-缓存一致性(MESI)
用于保证多个CPU cache之间缓存共享数据的一致
CPU多级缓存-乱序执行优化
处理器为了提高执行速度而做出的违背代码原有顺序的优化。在单核情况下没有问题,但是在多核环境下会出现问题。
JAVA内存模型(Java Memory Model,JMM)
这是一种规范,规范了Java虚拟机与计算机内存是如何协同工作的,规定了一个线程如何以及何时可以看到其他线程修改共享变量的值并且如何同步访问共享变量。
如上图所示,java内存模型要求,调用栈和本地变量存放在线程栈上,如图中Thread Stack,对象存放在堆中(Heap)。本地变量Local variable2是一个指向对象的引用,Local variable存放在线程栈上,但对象存放在堆上。存放在堆上的对象可以被所持有对这个对象引用的线程访问,并且可以访问这个对象的成员变量,而当两个线程同时访问object3上的同一个方法时,都会访问方法中的成员变量,那么每一个线程会拥有这个对象成员变量的私有拷贝。
线程之间的通信必须经过主内存,例如线程A想要与线程B进行通信,线程A需要将共享变量的副本刷新到主内存中,然后线程B读取主内存的线程A更新过的共享变量。因此会出现同步问题。
同步往往有8种操作:
- lock(锁定):作用于主内存的变量,把一个变量标识为一条线程独占状态。
- unlock(解锁):作用于主内存的变量,把一个处于锁定状态的变量释放出来,释放后的变量才可以被其他线程锁定。
- read(读取):作用于主内存的变量,把一个变量值从主内存传输到线程的工作内存中,以便随后的load动作使用
- load(载入):作用于工作内存的变量,它把read操作从主内存中得到的变量放入工作内存的变量副本中。
- use(使用):作用于工作内存的变量,把工作内存中的一个变量值传递给执行引擎。
- assign(赋值):作用于工作内存的变量,它把一个执行引擎接收到的值赋值给工作内存的变量。
- store(存储):作用于工作内存的变量,把工作内存中的一个变量的值传送到主内存中,以便随后的write操作。
- write(写入):作用于主内存的变量,它把store操作从工作内存中一个变量的值传送到主内存的变量中。
同步规则:
- 如果要把一个变量从主内存中复制到工作内存,就需要按顺序的执行read和load操作;如果把变量从工作内存中同步回主内存中,就要按顺序地执行store和write操作。但java内存模型只要求上述操作必须按顺序执行,而没有保证必须是连续执行。
- 不允许read和load、store和write操作之一单独出现。
- 不允许一个线程丢弃它的最近assign的操作,即变量在工作内存中改变了之后必须同步到主内存中。
- 不允许一个线程无原因的(没有发生过任何assign操作)把数据从工作内存同步回主内存中。
- 一个新的变量只能在主内存中诞生,不允许在工作内存中直接使用一个未被初始化(load或assign)的变量。即就是对一个变量实施use和store操作之前,必须先执行过assign和load操作。
- 一个变量在同一时刻只允许一条线程对其进行lock操作,但lock操作可以被同一条线程重复执行多次,多次执行lock后,只有执行相同次数的unlock操作,变量才会被解锁。lock和unlock必须成对出现。
- 如果对一个变量执行lock操作,将会清空工作内存中此变量的值,在执行引擎使用这个变量前需要重新执行load或assign操作初始化变量的值。
- 如果一个变量事先没有被lock操作锁定,则不允许对它执行unlock操作;也不允许去unlock一个被其他线程锁定的变量。
- 对一个变量执行unlock操作之前,必须先把此变量同步到主内存中(执行store和write操作)
并发的优势与风险
优势:
- 速度:同时处理多个请求,响应更快;复杂的操作可以分成多个进程同时进行。
- 设计:程序设计在某些情况下更简单,也可以有更多的选择。
- 资源利用:CPU能够在等待IO的时候做一些其他的事情。
风险:
- 安全性:多个线程共享数据时可能会产生与期望不相符的结果
- 活跃性:某个操作无法继续进行下去时,就会发生活跃性问题。比如死锁、饥饿等问题。
- 性能:线程过多会使得CPU频繁切换,调度时间增多,同步机制,消耗过多内存。