聚焦 DPU 技术研发与创新 天翼云打造全新一代云计算体系结构

天翼云开发者社区
• 阅读 415

9月2日,第二届SmartNIC&DPU技术创新峰会在北京召开。本次大会由江苏省未来网络创新研究院和SDNLAB联合行业技术先锋力量、产业典型应用企业共同发起,围绕SmartNIC/DPU技术创新、产业应用等问题展开研讨与交流。大会现场还发布了2022 SmartNIC & DPU Awards年度评选结果,天翼云DPU云核为基础打造的全新云计算体系结构荣获匠芯技术奖。 聚焦 DPU 技术研发与创新 天翼云打造全新一代云计算体系结构

在SmartNIC&DPU技术分会场,天翼云科技有限公司资深研发专家刘禄仁分享了天翼云DPU技术的研发与实践经验。他表示,天翼云作为国内领先的云服务商,基于当前DPU技术演进路线,结合需求的零散化、动态变化以及对DPU产品线上运维问题的考量,以FPGA+CPU的架构作为切入点,成功研发出天翼云DPU1.0产品,并以自研DPU云核为基础打造了为云而生的全新云计算体系结构。

当前,摩尔定律的放缓与全球数据量爆发之间的矛盾正在迅速激化。IDC数据显示,全球数据量在过去10年年均复合增长率接近50%,并进一步预测每四个月对于算力的需求就会翻一倍。与此相对的是,传统的数据中心架构难以满足大规模的算力需求,CPU性能每年仅提升3%,形成了明显的“剪刀差”现象。在CPU无法满足庞大算力需求的背景下,DPU应运而生。 聚焦 DPU 技术研发与创新 天翼云打造全新一代云计算体系结构

DPU作为计算负载的引擎,直接效果是给CPU“减负”,能够提高数据中心的运算效率,减少能耗浪费,进而降低成本,在数字时代具有巨大的商业价值与发展潜力。天翼云DPU1.0实现了虚拟化的零损耗,具备高性能、低延迟、低抖动的特性,网络转发性能高达4000万PPS,存储云盘IOPS可以达到60W。此外,天翼云DPU1.0通过将传统运行在主机侧的应用转到DPU云核上,减少大量的适配工作,在主机不同算力核和不同架构上可做到即插即用。 此外,从产品的研发到落地,天翼云DPU团队在网络、存储及RDMA方面也积累了丰富的实践经验。

在网络卸载方面,针对流表数量大、转发性能要求高、对SoC和FPGA的内存容量需求大、稳定性要求高等挑战,天翼云对rte_flow等主要数据结构进行压缩,并对流表空中计算,优化裁剪offload卸载路径的多层级缓存,从而支持4M流表,实现了内存优化;对所有流表进行合并计算,避免在硬件层执行包重注,使转发效率达到4000万PPS;基于硬件精确流表特点设计专用老化统计线程,减轻OVS Revalidator压力;初步拆分OVS的统计和老化事务逻辑,优化硬件流表的老化统计上报实现逻辑,提升软件OVS Revalidator执行效率;支持热升级、热迁移及热恢复,做到B/V/C全场景的并池,大幅提升稳定性。

在存储卸载方面,针对经常出现的SoC异常重启、SPDK异常重启、热迁移丢IO等现象,天翼云从中抽象出共同特性,利用软件协同的思想,将SoC侧软件的正常行为和异常行为进行统一,组件启动时统一发送msg信息给硬件,硬件收到该msg会解析其内容,进而从硬件保存的queue指针信息进行分析,在用户无感状态下实现全部异常的统一化处理。

在高性能网络方面,拥塞算法是RDMA的核心和关键,为提高RDMA网络的性能,天翼云聚焦下一代高效CC算法设计,以更好地避免拥塞、保证公平性,实现更快速收敛、更低时延、更简单部署。针对不同应用场景,天翼云设计了2套算法eSurfing-CC: 针对智能网卡+商用交换机的组合,提出基于RTT+CNP的2段式端到端CC算法,具有主动拥塞控制、无需依赖交换机的配置、支持快速启动快速收敛等优势;针对智能网卡+可编程交换机的组网场景,天翼云在交换机上部署CC算法,使交换机同样具备主动拥塞通知能力和主动发包能力,可以有效降低端到端响应时延,同时简化建模和配置复杂度,提高系统的可扩展性。

目前,基于天翼云DPU核心技术打造的多款产品已落地应用,以天翼云弹性裸金属服务器为例,该服务器兼具云服务器弹性和物理机性能,通过将网络、存储等功能卸载至DPU卡,可极大降低物理机侧CPU和内存等资源消耗,最终算力远超普通云主机,现已服务于金融、汽车等多行业企业。

随着5G时代数据量和传输速度的飞速增长,国内厂商争相进入DPU赛道。根据Canalys Cloud Channels Analysis预测,到2023年,中国DPU市场规模将达190亿人民币。可以预见,在数据中心流量不断加大的情况下,DPU帮助数据中心提升算力、降低成本与能耗的同时,将有更大的施展空间和广阔的发展前景。

点赞
收藏
评论区
推荐文章
干货!天翼云DPU技术解码
9月2日,第二届SmartNIC&DPU技术创新峰会在京举行,天翼云在2022SmartNIC&DPUAwards年度评选中荣获匠芯技术奖。天翼云资深研发专家刘禄仁出席SmartNIC&DPU技术分会场并发表“天翼云DPU技术研究和实践”主题演讲,向行业分享天翼云以DPU为核心的新一代计算架构的研究及场景落地。随着数据量爆发式增长,数据中心规模持续扩大,
第二届SmartNIC&DPU技术创新峰会即将开幕,速来围观!
9月2日,聚焦于智能网卡与DPU相关技术的第二届SmartNIC&DPU技术创新峰会将在北京举行。天翼云资深研发专家刘禄仁将出席会议并发表“天翼云DPU技术研究和实践”主题演讲,向行业展示以DPU为核心的新一代架构,并分享天翼云在DPU技术上的思考、研究及落地实践。近年来,新一代信息技术的迅速发展与普及带来云、边、端的数据井喷,给网络带来了更多元复杂的需求,
云行 | 天翼云中国行走进宁波,推动千行百业迈向数字化转型之路
9月2日,2022世界数字经济大会暨第十二届智慧城市与智能经济博览会(简称“智博会”)在宁波启幕。在此期间,以“算力网络,连接未来”为主题的天翼云中国行活动成功举办,宁波政府部门领导、各合作伙伴企业代表与天翼云共聚一堂,聚焦云计算、人工智能等技术创新,深度探讨产业数字化发展趋势与变革路径。活动现场举行了天翼云“一城一池”宁波节点落地发布仪式、战略客户签约仪式
天翼云加码边缘计算,让普惠算力触手可及!
8月25日,亚太内容分发大会暨CDN峰会在京召开。大会汇集CDN产业领军企业,聚焦产业前沿科技突破,共同探讨边缘计算发展趋势与创新应用。天翼云科技有限公司高级研发经理张其栋出席“边缘计算论坛”并发表主题演讲,分享了天翼云边缘计算的发展规划与实践案例。天翼云科技有限公司高级研发经理张其栋当前,边缘计算发展势头强劲,Gartner预计到2025年将有超过75%的
又双叒叕获奖!天翼云推动算力服务便捷普惠泛在!
2023年6月30日,由中国信息通信研究院、中国通信标准化协会主办的“2023云边协同大会”在北京举办。大会聚集了产学研用各界大咖,深入探讨云边协同趋势及产业创新发展。大会颁发了多个奖项,天翼云分别斩获三项“分布式云技术创新先锋案例”奖,两项“2023年度分布式云最佳实践先锋案例”奖、20222023年度云边协同“领航人物”奖
登上国际舞台!天翼云P4 EIP网关流量管理创新方案亮相CCGrid 2024!
5月8日,第24届IEEE/ACM集群、云和互联网计算国际研讨会(CCGrid2024)在美国费城隆重举行。来自中国、美国、印度、法国等国家的学术及产业界代表齐聚一堂,围绕云计算相关议题进行深入探讨和交流,并带来最前沿的技术展示。天翼云云网产品事业部弹性网络产品线总监侯叶飞出席大会硬件系统和网络分论坛,对本次被CCGrid长文收录的论文《TowardsBetterQoSandLowerCostsofP4EIPGatewayattheEdge》进行专业解析,并分享了天翼云在开放数据中心网络及可编程网关领域的创新与实践经验,再次彰显了天翼云的技术创新实力。
荣誉再加码!2024可信云大会,天翼云载誉而归!
7月23日,由中国通信标准化协会主办,中国信息通信研究院(以下简称“中国信通院”)承办的2024可信云大会在北京成功召开。大会主论坛上,中国信通院携手天翼云共同发布《央国企云上数智实践指南(2024)》,天翼云科技有限公司助理总经理宫梅霞出席发布仪式;同时,天翼云还参加了《云网融合下智能算力网络应用发展白皮书——基于DPU的SRv6应用实践》《低空经济云发展研究报告》《大模型智算服务研究报告》等多个重磅仪式,通过多项可信云评估并斩获多项“最佳实践”奖。天翼云科技有限公司行业事业部总经理王晓东发表演讲,与业内伙伴共话云计算产业发展与未来趋势。
亮相2024 DPU&AI Networking创新大会,天翼云斩获两项大奖!
近日,以“智驱网络芯动未来”为主题的2024DPU&AINetworking创新大会在北京举办。大会表彰了在DPU与AI网络技术创新及实践应用中取得卓越成就的单位与项目,天翼云科技有限公司荣膺创新引擎奖、《紫金DPU算力卸载与网络加速应用》荣获实践先锋奖,技术创新实力以及应用实践成果再获行业认可。
解锁数据潜力,天翼云TeleDB为企业数智蝶变添力赋能!
近日,第15届中国数据库技术大会(DTCC2024)在北京召开。大会以“自研创新数智未来”为主题,重点围绕向量数据库与向量检索技术实践、数据治理与数据资产管理、云原生数据库开发与实践、特定场景下的数据库管理与优化、大数据平台建设等内容展开分享和探讨。天翼云数据库产品线首席技术官李跃森、天翼云资深研发专家胡彬参会,分享了天翼云在数据库领域的产品布局、技术创新与实践应用。
开源标杆!天翼云TeleDB入选《2024央国企开源项目典型实践》!
近日,由中国通信标准化协会主办、中国信通院承办的2024OSCAR开源产业大会在北京召开,会上发布《2024央国企开源项目典型实践》,天翼云科技有限公司打造的“TeleDB分布式数据库在开源社区的特性贡献案例”成功入选。本次入选不仅是对天翼云TeleDB数据库技术创新性的权威认可,也进一步提升了天翼云TeleDB数据库在开源领域的行业认可度和影响力。
天翼云开发者社区
天翼云开发者社区
Lv1
天翼云是中国电信倾力打造的云服务品牌,致力于成为领先的云计算服务提供商。提供云主机、CDN、云电脑、大数据及AI等全线产品和场景化解决方案。
文章
696
粉丝
15
获赞
40