Java原子类操作原理剖析

Wesley13
• 阅读 752


CAS的概念

对于并发控制来说,使用锁是一种悲观的策略。它总是假设每次请求都会产生冲突,如果多个线程请求同一个资源,则使用锁宁可牺牲性能也要保证线程安全。而无锁则是比较乐观的看待这个问题,它会假设每次访问都没有冲突,这样就提高了效率。但是事实难料、这个冲突是避免不了的,无锁也考虑到了肯定会遇到冲突,对于冲突的解决无锁就使用一种比较交换(CAS)的技术来检测冲突。一旦检测到冲突就重试当前操作直到成功为止。


CAS算法

CAS机制中使用了3个基本操作数CAS(V,E,N):V表示要更新的变量,E表示预期值,N表示新值。

CAS更新一个变量的时候,只有当变量的预期值E和要更新的变量V的实际值相同时,才会将V的值修改为N。

一个简单的例子:
在内存地址V当中,存储一个值为1的变量。

此时线程1想把变量的值增加1.对线程1来说,预期值E=1,要修改的新值N=2.

在线程1要提交更新之前,另一个线程2抢先一步,把V的值率先更新成了2。

此时线程1开始提交更新,首先进行预期值E和变量V的实际值比较,发现E不等于V的实际值,提交失败。

失败后线程1 重新获取内存地址V的当前值,并重新计算想要修改的值。此时对线程1来说,E=2,V=2。这个重新尝试的过程被称为自旋。

如果这一次依然在提交时发现被线程2把V值更新到了3则再次重复步骤5。此时E=3,V=3

步骤5执行执行完毕后再次更新发现没有其他线程改变V的值。线程1进行比较,发现A和V的值是相等的。则线程1进行交换,把V的值替换为N,也就是2.


Java中CAS的底层实现

我们看一下AtomicInteger当中常用的自增方法incrementAndGet:

123

public final int incrementAndGet() { return unsafe.getAndAddInt(this, valueOffset, 1) + 1; }

这里涉及到两个重要的对象,一个是unsafe,一个是valueOffset。

unsafe是什么东西呢?它JVM为我们提供了一个访问操作系统的后门,unsafe为我们提供了硬件级别的原子操作。而valueOffset对象,是通过unsafe.objectFiledOffset方法得到,所代表的是AtomicInteger对象value成员变量在内存中的偏移量。我们可以简单的把valueOffset理解为value变量的内存地址。

而unsafe的getAndAddInt方法顾名思义就是使用操作系统的原子操作来为我们实现当前的的++操作并把旧值返回回来。因为是返回的旧值所以
incrementAndGet方法返回的数据应该是这个旧值加上1


CAS的缺点

CPU开销过大
在并发量比较高的情况下,如果许多线程反复尝试更新某一个变量,却又一直更新不成功,循环往复,会给CPU带来很到的压力。
    
不能保证代码块的原子性
CAS机制所保证的知识一个变量的原子性操作,而不能保证整个代码块的原子性。比如需要保证3个变量共同进行原子性的更新,就不得不使用synchronized了。

ABA问题
这是CAS机制最大的问题所在。

我们现在来说什么是ABA问题。

假设小王账户有1000块钱,即v=1000。

这时有三个线程想使用CAS的方式更新这个小王的账户。线程1和线程2已经获取当前账户余额为1000,线程3还未获取当前值。

线程1为花呗扣款、线程2为花呗扣款的备用操作(避免第一次扣款失败),线程3为工资入账

接下来,线程1先一步执行成功,把当前账户成功从1000减少到500;同时线程2因为某种原因被阻塞住,没有及时扣款;线程3在线程1扣款之后,获取了当前值500。

在之后,线程2仍然处于阻塞状态,线程3继续执行,成功入账工资500,把当前值又变回了1000。

此时,线程2恢复运行状态,进行更新之前查询E和V相同,所以毫不犹豫的进行又一次账户扣款。

这种扣款的方式对于小王来说肯定是不可接受的(估计都要疯了),解决方案就是在操作的时候加个版本号或者是时间戳来标示状态信息。

同样以刚才的例子来说:

假设小王账户有1000块钱,即v=1000。

这时有三个线程想使用CAS的方式更新这个小王的账户。线程1和线程2已经获取当前账户余额为1000,线程3还未获取当前值。但是呢,这里线程1和2还需要记录一个获取当前账户余额的最后更新时间,比如9.30.

同样的线程1为花呗扣款、线程2为花呗扣款的备用操作(避免第一次扣款失败),线程3为工资入账。

接下来,线程1先一步执行成功,把当前账户成功从1000减少到500;此时账户余额的时间戳就已经变了,比如9.31。同时线程2因为某种原因被阻塞住,没有及时扣款;线程3在线程1扣款之后,获取了当前值500和时间戳9.31。

在之后,线程2仍然处于阻塞状态,线程3继续执行,成功入账工资500,把账户又变回了1000,同时时间戳更新为9.32。

此时,线程2恢复运行状态,进行更新之前查询E和V虽然相同,但是时间戳确是不一样的。


Java提供的12种原子操作类

原子更新基本类型

123

AtomicBoolean:原子更新布尔类型。AtomicInteger:原子更新整型。AtomicLong:原子更新长整型。

原子更新数组

123

AtomicIntegerArray:原子更新整型数组里的元素。AtomicLongArray:原子更新长整型数组里面的元素。AtomicReferenceArray:原子更新引用类型数组里的元素。

原子更新引用类型

123

AtomicReference:原子更新引用类型。AtomicReferenceFieldUpdater:原子更新引用类型里的字段。AtomicMarkableReference:原子更新带有标记位的引用类型。

原子更新字段

123

AtomicIntegerFieldUpdater:原子更新整型字段的更新器。AtomicLongFieldUpdater:原子更新长整型字段的更新器。AtomicStampedReference:原子更新带有版本号的引用类型。
点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
待兔 待兔
4个月前
手写Java HashMap源码
HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程22
Jacquelyn38 Jacquelyn38
3年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
Easter79 Easter79
3年前
Twitter的分布式自增ID算法snowflake (Java版)
概述分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的。有些时候我们希望能使用一种简单一些的ID,并且希望ID能够按照时间有序生成。而twitter的snowflake解决了这种需求,最初Twitter把存储系统从MySQL迁移
Wesley13 Wesley13
3年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Wesley13 Wesley13
3年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Stella981 Stella981
3年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
10个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这