并发编程体系概述

京东云开发者
• 阅读 13

作者:京东自有品牌 周振

类别 定义 特点 应用场景 Java中的使用
进程 (Process) 计算机程序在操作系统中执行的实例 - 独立性强、 拥有独立的内存空间、 创建和销毁开销大- 进程间通信复杂 - 独立的应用程序 - 高隔离性任务,如数据库服务器 - Java应用程序运行在JVM进程中 - 通过ProcessBuilder调用外部进程
线程 (Thread) 进程中的执行单元,共享进程的内存空间和资源 - 轻量级- 共享内存- 创建和销毁开销较小- 并发执行 - 多任务处理,如GUI应用 - 并行计算 - 使用java.lang.Thread类 - 利用java.util.concurrent包 - 线程池(ExecutorService)管理线程
协程 (Coroutine) 更轻量级的并发单元,通过用户态上下文切换实现 - 更轻量级- 非抢占式调度- 高效I/O处理 - I/O密集型任务,如网络爬虫 高并发Web应用 - Java本身不直接支持 - 使用Kotlin协程实现异步编程

协程在处理高并发和I/O密集型任务时,具有明显的优势,尤其是在编写异步代码时更加简洁和高效。然而,对于CPU密集型任务和传统的多任务处理,线程仍然是一个成熟且有效的选择。

选择协程还是线程,取决于具体的应用场景和需求。随着Kotlin协程在Java生态系统中的普及,越来越多的中间件和框架开始支持协程。

但是并不一定要使用协程,使用基于多线程的分布式并发框架也可以实现类似的效果、如akka、Spring WebFlux等。

多线程知识汇总

基础知识

具体可以查找我之前博客: https://blog.csdn.net/Zzhou1990/article/details/106008171

并发编程体系概述





响应式编程



特性 CompletableFuture Stream Optional Observable (RxJava 1) Observable (RxJava 2) Flowable (RxJava 2) Flux Akka Streams
可组合的
惰性的
可重用的 ✔ (部分)
异步的
可缓存的 ✔ (需显式调用) ✔ (需显式调用) ✔ (需显式调用) ✔ (需显式调用)
推送的
背压的
操作符融合

Show me code

获取时间的并发问题

总结起来原因是System.currentTimeMillis调用了gettimeofday()

调用gettimeofday()需要从用户态切换到内核态;

gettimeofday()的表现受Linux系统的计时器(时钟源)影响,在HPET计时器下性能尤其差;

系统只有一个全局时钟源,高并发或频繁访问会造成严重的争用

所以中间件在获取时间时候会有一个单例线程。

分析文章地址 http://pzemtsov.github.io/2017/07/23/the-slow-currenttimemillis.html

阿里sentine获取时间工具类

public final class TimeUtil {

    private static volatile long currentTimeMillis;

    static {
        currentTimeMillis = System.currentTimeMillis();
        Thread daemon = new Thread(new Runnable() {
            @Override
            public void run() {
                while (true) {
                    currentTimeMillis = System.currentTimeMillis();
                    try {
                        TimeUnit.MILLISECONDS.sleep(1);
                    } catch (Throwable e) {

                    }
                }
            }
        });
        daemon.setDaemon(true);
        daemon.setName("sentinel-time-tick-thread");
        daemon.start();
    }

    public static long currentTimeMillis() {
        return currentTimeMillis;
    }
}

json转换的性能问题

    List<VendorAllVo> vendorList = vendorInfoMapper.findVendorList();
    log.info("日志输出:{}", JSONUtils.toJSONString(vendorList));

    if(log.isInfoEnabled()){
        log.info("日志输出:{}", JSONUtils.toJSONString(vendorList));
    }
class User {
    private long id;
    private String name;
    private String email;
}

  public User getUserInfoLowPerformance(long userId) {
        String key = USER_INFO_KEY + ":" + userId;
        String jsonUser = (String) redisTemplate.opsForValue().get(key);
        if (jsonUser == null) {
            return null;
        }
        return new Gson().fromJson(jsonUser, User.class);
    }


    public User getUserInfo(long userId) {

        Map<String, Object> userInfoMap = redisTemplate.opsForHash().entries(key);
        if (userInfoMap.isEmpty()) {
            return null;
        }

        user = new User();
        user.setId((Long) userInfoMap.get("id"));
        user.setName((String) userInfoMap.get("name"));
        user.setEmail((String) userInfoMap.get("email"));
        //...
     }

循环处理

循环会将低性能代码放大,主要查看以下,使用异步或非核心操作不是必须在响应前完成。

查找数据O(1)、使用IO网络、缓存、磁盘、使用cpu等操作

流式编程

流程编程、caffeine缓存、批处理优化;减少阻塞等待

case改造案例:50ms -> 15ms

UMP和泰山

UMP秒级监控、强大泰山整合了UMP、链路追踪、硬件监控、负载均衡等,内部优秀的工具帮助监控性能问题;

通过UMP秒级监控作为入口,秒级监控需手动开启,限制接口50个

并发编程体系概述





Tp99/Tp999;可用率等;下钻查看每个机器的流量,这些可以根据机器配置在NP平台调整权重以及负载策略,继续根据机器查看



并发编程体系概述



生态和体系

并发&IO

并发编程体系概述





并发编程体系概述





并发&内存&CPU

JVM内存模型,不同的jdk版本;确保内存可见性和指令重排序的规则、以及线程的调度

JVM gc参数设置、包括gc频率、相关参数线程数

用户态和内核态切换。

并发&锁

选择不同的锁,会对并发产生比较大的影响;

锁分类 : 互斥锁、自旋锁、读写锁、乐观锁、悲观锁、锁分段(表锁、行锁、间隙锁)、无锁cas

https://blog.csdn.net/Zzhou1990/article/details/114393298?spm=1001.2014.3001.5501

并发&中间件

数据库、缓存、断路器(限流、降级、合并)、服务间调用、配置中心、链路追踪、日志、JMQ

基数和标准:一次Tcp连接时间、一次Http连接时间

如机器配置4核8g mysql, qps和tps 响应时间根据sql复杂度从几十ms~ns不等

如机器配置8核32C redis qps 响应时间从nms~100ms

其他:

堆外内存

减少gc、序列化和反序列化。

字节码增加

Ask gpt4.0 字节码增强如何提高代码性能

缓存行

64Kb、Disruptor、伪共享

https://tech.meituan.com/2016/11/18/disruptor.html

类似概念磁盘顺序读写

局部性原理和分支优化

空间局部性优化:使用数组、合理模型结构

较少分支、分支展开、条件合并

性能分析、火焰图 http://jagile.jd.com/shendeng/article/detail/1680

如何写出让CPU跑得更快的代码 = 如何写出让CPU缓存命中率更高的代码

并发不只是并发,他还是个策略问题:处理数据的时候选择合适的策略,可能数据很快就会跑出来。

问下chatgpt:从kafka架构设计角度说说高并发怎么实现、用户态和内核态、

点赞
收藏
评论区
推荐文章
lucien-ma lucien-ma
3年前
什么是线程?什么是进程?
Java多线程基础进程和线程的概念应用程序是静态的概念,进程和线程是动态概念,有创建就有销毁,存在也是暂时的,不是永久性的。进程与线程的区别在于进程在运行时拥有独立的内存空间(每个进程所占有的内存都是独立的)多个线程是共享内存空间的,但是每个线程的执行时相互独立的,同时线程必须依赖于进程才能执行,单独的线程是无法执行的,由进程来控制多个线程的执行。
Wesley13 Wesley13
3年前
java多线程大汇总,线程与进程,线程调度,并发与并行,创建线程方式,线程生命周期,线程安全,线程通信,线程池
1.线程与进程进程是指一个内存中运行的应用程序,每个进程都有一个独立的内存空间线程1、是进程中的一个执行路径,共享一个内存空间,线程之间可以自由切换,并发执行.一个进程最少有一个线程2、线程实际上是在进程基础之上的进一步划分,一个进程启动之后,里面的若干执行路径又可以划分成若干个线程
Wesley13 Wesley13
3年前
Java并发基础
一、多线程基础知识1.进程和线程进程:是指一个内存中运行的应用程序,每个进程都有一个独立的内存空间,一个应用程序可以同时运行多个进程;进程也是程序的一次执行过程,是系统运行程序的基本单位;系统运行一个程序即是一个进程从创建、运行到消亡的过程。线程:进程内部的一个独立执行单元;一个进程可以同时并发的运行多个线程,
Wesley13 Wesley13
3年前
Java指定网页打开Chrome浏览器
ProcessProcessBuilder.start() 和 Runtime.exec 方法创建一个本机进程,并返回Process子类的一个实例,该实例可用来控制进程并获得相关信息。ProcessBuilder此类用于创建操作系统进程。Runtime每个Java应用程序都有一个Runtime类实例,使
Wesley13 Wesley13
3年前
Java总结:Java多线程
多线程作为Java中很重要的一个知识点,在此还是有必要总结一下的。Java给多线程编程提供了内置的支持。一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务。多线程是多任务的一种特别的形式,但多线程使用了更小的资源开销。这里定义和线程相关的另一个术语进程:一个进程包括由操作系统分配的内存空间,
Wesley13 Wesley13
3年前
Java面试官都爱问的多线程和并发面试题汇总,多刷一题,多份安心!
Java多线程面试问题1、进程和线程之间有什么不同?一个进程是一个独立(selfcontained)的运行环境,它可以被看作一个程序或者一个应用。而线程是在进程中执行的一个任务。Java运行环境是一个包含了不同的类和程序的单一进程。线程可以被称为轻量级进程。线程需要较少的资源来创建和驻留在进
Stella981 Stella981
3年前
Linux进程间的通信方式和原理
进程的概念进程是操作系统的概念,每当我们执行一个程序时,对于操作系统来讲就创建了一个进程,在这个过程中,伴随着资源的分配和释放。可以认为进程是一个程序的一次执行过程。进程通信的概念进程用户空间是相互独立的,一般而言是不能相互访问的。但很多情况下进程间需要互相通信,来完成系统的某项功能。进程通过与内核及其
Wesley13 Wesley13
3年前
Java中多线程并发体系知识点汇总
一、多线程1、操作系统有两个容易混淆的概念,进程和线程。进程:一个计算机程序的运行实例,包含了需要执行的指令;有自己的独立地址空间,包含程序内容和数据;不同进程的地址空间是互相隔离的;进程拥有各种资源和状态信息,包括打开的文件、子进程和信号处理。线程:表示程序的执行流程,是CPU调度执行的基本单位;线程有自己的程序计数器、寄存器、堆栈和帧。同一进
Wesley13 Wesley13
3年前
Java 基础夺命连环16问(面试硬核敲门砖 )
说说进程和线程的区别?进程是程序的一次执行,是系统进行资源分配和调度的独立单位,他的作用是是程序能够并发执行提高资源利用率和吞吐率。由于进程是资源分配和调度的基本单位,因为进程的创建、销毁、切换产生大量的时间和空间的开销,进程的数量不能太多,而线程是比进程更小的能独立运行的基本单位,他是进程的一个实体,可以减少程序并发执行时的时间和空间开销,
胖大海 胖大海
2年前
linux 进程管理
1\.为什么要引入进程主要是为了提高CPU利用率,人们设计了在一台计算机实现能将多个程序同时加载、并发执行,从而引入进程的概念。每个加载到内存中的程序都称为进程,操作系统管理者多个进程并发执行。进程会认为自己独立占用CPU资源2\.进程的概念2.1进程的定义进程是指一个具有一定独立功能的程序在一个数据集合上的一次动态执行过程进程包含了正