干货!天翼云DPU技术解码

天翼云开发者社区
• 阅读 516

9月2日,第二届SmartNIC&DPU技术创新峰会在京举行,天翼云在2022 SmartNIC&DPU Awards年度评选中荣获匠芯技术奖。天翼云资深研发专家刘禄仁出席SmartNIC&DPU技术分会场并发表“天翼云DPU技术研究和实践”主题演讲,向行业分享天翼云以DPU为核心的新一代计算架构的研究及场景落地。 干货!天翼云DPU技术解码

随着数据量爆发式增长,数据中心规模持续扩大,驱动网络带宽不断升级,以满足当前和未来云端海量数据流需求。在摩尔定律明显放缓的背景下,随着更高带宽的到来,CPU算力增长速度和数据中心网络传输速率增长速度的差距被逐渐拉大,效率更高的计算芯片成为刚需,DPU应运而生。

DPU作为计算负载的引擎,直接效果是给CPU“减负”,能够提高数据中心的运算效率,减少能耗浪费,进而降低成本,在数字时代具有巨大的商业价值与发展潜力。

天翼云作为国内领先的云服务商,抢跑DPU赛道,基于当前DPU技术演进路线,结合需求的零散化、动态变化以及对DPU产品线上运维问题的考量,以FPGA+CPU的架构作为切入点,成功研发出天翼云DPU1.0产品,并以DPU云核为基础打造了为云而生的全新云计算体系结构。 干货!天翼云DPU技术解码

天翼云DPU1.0实现了虚拟化的零损耗,具备高性能、低延迟、低抖动的特性,网络转发性能高达4000万PPS,存储云盘IOPS可以达到60W。此外,天翼云DPU1.0还可以将传统运行在主机侧的应用转到DPU云核上,减少大量的适配工作,在主机不同算力核和不同架构上做到即插即用。

在天翼云DPU1.0产品从研发到落地的过程中,天翼云DPU团队在网络、存储及RDMA方面进行了丰富的实践。

在网络卸载方面 针对流表数量大、转发性能要求高、对SoC和FPGA的内存容量需求大、稳定性要求高等挑战,天翼云对rte_flow等主要数据结构进行压缩,并对流表空中计算,优化裁剪offload卸载路径的多层级缓存,从而支持4M流表,实现了内存优化;对所有流表进行合并计算,避免在硬件层执行包重注,使转发效率达到4000万PPS;

基于硬件精确流表特点设计专用老化统计线程,减轻OVS Revalidator压力;初步拆分OVS的统计和老化事务逻辑,优化硬件流表的老化统计上报实现逻辑,提升软件OVS Revalidator执行效率;支持热升级、热迁移及热恢复,做到B/V/C全场景的并池,大幅提升稳定性。

在存储卸载方面 针对经常出现的SoC异常重启、SPDK异常重启、热迁移丢IO等现象,天翼云从中抽象出共同特性,利用软件协同的思想,将SoC侧软件的正常行为和异常行为进行统一,组件启动时统一发送msg信息给硬件,硬件收到该msg会解析其内容,进而从硬件保存的queue指针信息进行分析,在用户无感状态下实现全部异常的统一化处理。

在高性能网络方面 拥塞算法是RDMA的核心和关键,为提高RDMA网络的性能,天翼云聚焦下一代高效CC算法设计,以更好地避免拥塞、保证公平性,实现更快速收敛、更低时延、更简单部署。针对不同应用场景,天翼云设计了2套算法eSurfing-CC:

▎针对智能网卡+商用交换机的组合,提出基于RTT+CNP的2段式端到端CC算法,具有主动拥塞控制、无需依赖交换机的配置、支持快速启动快速收敛等优势; ▎针对智能网卡+可编程交换机的组网场景,在交换机上部署CC算法,使交换机同样具备主动拥塞通知能力和主动发包能力,可以有效降低端到端响应时延,同时简化建模和配置复杂度,提高系统的可扩展性。

目前,基于天翼云DPU核心技术打造的多款产品已落地应用,以天翼云弹性裸金属服务器为例,该服务器兼具云服务器弹性和物理机性能,通过将网络、存储等功能卸载至DPU卡,可极大降低物理机侧CPU和内存等资源消耗,最终算力远超普通云主机,现已服务于金融、汽车等多行业企业。 干货!天翼云DPU技术解码 干货!天翼云DPU技术解码

会上,还发布了2022 SmartNIC&DPU Awards年度评选结果,天翼云凭借以DPU云核为基础打造的全新一代云计算体系结构,荣获匠芯技术奖。该体系结构将计算、存储、网络和安全算力迁移到自研的软硬结合体系中,构建了面向不同算力、全国产化自主可控的第二平面,可实现网络、计算、存储资源云化加速,在DPU领域极具创新性。

DPU、CPU、GPU将成为未来计算市场的三大支柱,DPU作为计算市场的“芯”生事物,在技术标准和生态方面仍处于早期阶段,具有广阔的发展前景。未来天翼云将持续探索DPU技术,不断完善DPU产品,助力海量算力高效释放,助推数字经济发展。

点赞
收藏
评论区
推荐文章
公众版与政企版,这两款云电脑我都要!
8月18日,以“自主领先,畅游云端”为主题的天翼云电脑专题讲座在线上召开。天翼云科技有限公司研发二部高级产品经理梁胜蓝作为主讲人,对天翼云电脑不同版本的功能、特点进行了介绍,并分享了天翼云电脑在政企办公、在线教学等不同场景中的应用实践。近年来,随着5G、云计算等新兴技术快速发展,数字化办公正在成为企业办公的一大趋势。天翼云电脑具有便捷易用、安全可信等优势,可
加快云网融合发展,打通算力传输大动脉!
8月24日25日,第六届未来网络发展大会在南京举办,天翼云受邀参加25日举办的“云网融合与云原生网络论坛”。天翼云研发一部副总经理杨鑫发表题为《天翼云网络及云网融合实践》的演讲,详细介绍了天翼云网络技术与产品特性和布局,以及在多个行业中的云网融合应用实践。如今,数字经济底座正从连接为主的网络基础设施向云网融合的数字信息基础设施加速演进。天翼云历经十年发展,构
第二届SmartNIC&DPU技术创新峰会即将开幕,速来围观!
9月2日,聚焦于智能网卡与DPU相关技术的第二届SmartNIC&DPU技术创新峰会将在北京举行。天翼云资深研发专家刘禄仁将出席会议并发表“天翼云DPU技术研究和实践”主题演讲,向行业展示以DPU为核心的新一代架构,并分享天翼云在DPU技术上的思考、研究及落地实践。近年来,新一代信息技术的迅速发展与普及带来云、边、端的数据井喷,给网络带来了更多元复杂的需求,
重磅发布!《天翼云白皮书》+天翼云紫金DPU来了!
12月29日,由中国电信主办的“2022天翼数字科技生态大会”在云端召开。会上,中国电信总经理邵广禄发布了天翼云两项重要成果——《天翼云白皮书》和天翼云紫金DPU。《天翼云白皮书》阐述了发展愿景、发展目标、演进路径、关键举措,并在天翼云发展愿景和使命方面这
殊荣双至,天翼云边缘计算再获两项大奖!
近日,全球边缘计算大会·北京站在新世界大酒店成功召开。大会公布了“2023金边奖”评选结果,天翼云斩获“最佳智能边缘云服务商”“最佳边缘安全加速平台”两项大奖。天翼云边缘计算产品专家熊瑶、天翼云边缘安全产品专家杜茜参加会议并分别发表演讲,分享了天翼云边缘计算发展规划与实践。
荣誉再加码!2024可信云大会,天翼云载誉而归!
7月23日,由中国通信标准化协会主办,中国信息通信研究院(以下简称“中国信通院”)承办的2024可信云大会在北京成功召开。大会主论坛上,中国信通院携手天翼云共同发布《央国企云上数智实践指南(2024)》,天翼云科技有限公司助理总经理宫梅霞出席发布仪式;同时,天翼云还参加了《云网融合下智能算力网络应用发展白皮书——基于DPU的SRv6应用实践》《低空经济云发展研究报告》《大模型智算服务研究报告》等多个重磅仪式,通过多项可信云评估并斩获多项“最佳实践”奖。天翼云科技有限公司行业事业部总经理王晓东发表演讲,与业内伙伴共话云计算产业发展与未来趋势。
行业标准引领者!天翼云助推智算领域规范化发展!
7月24日,2024可信云大会召开期间,智算云服务论坛上,天翼云荣获中国信通院颁发的“智算工程平台能力要求标准参编证书”,代表了业界对天翼云在推动行业标准制定中所作贡献及成果的重要肯定,以及对天翼云技术创新水平的高度认可。会上,天翼云科技有限公司智算产品线资深技术专家瞿龙发表演讲,介绍了天翼云智算平台加速大模型应用方面的技术亮点与成功案例。
亮相2024 DPU&AI Networking创新大会,天翼云斩获两项大奖!
近日,以“智驱网络芯动未来”为主题的2024DPU&AINetworking创新大会在北京举办。大会表彰了在DPU与AI网络技术创新及实践应用中取得卓越成就的单位与项目,天翼云科技有限公司荣膺创新引擎奖、《紫金DPU算力卸载与网络加速应用》荣获实践先锋奖,技术创新实力以及应用实践成果再获行业认可。
解锁数据潜力,天翼云TeleDB为企业数智蝶变添力赋能!
近日,第15届中国数据库技术大会(DTCC2024)在北京召开。大会以“自研创新数智未来”为主题,重点围绕向量数据库与向量检索技术实践、数据治理与数据资产管理、云原生数据库开发与实践、特定场景下的数据库管理与优化、大数据平台建设等内容展开分享和探讨。天翼云数据库产品线首席技术官李跃森、天翼云资深研发专家胡彬参会,分享了天翼云在数据库领域的产品布局、技术创新与实践应用。
引领行业数字变革,天翼云出席IDC年度盛典暨颁奖典礼!
近日,2024IDC中国年度盛典暨颁奖典礼在上海隆重开幕。天翼云出席大会数字工业行业峰会及金融行业峰会,分享了天翼云的智算布局及在行业数字化转型方面的技术探索和实践成果。
天翼云开发者社区
天翼云开发者社区
Lv1
天翼云是中国电信倾力打造的云服务品牌,致力于成为领先的云计算服务提供商。提供云主机、CDN、云电脑、大数据及AI等全线产品和场景化解决方案。
文章
696
粉丝
15
获赞
40