“翼”鸣惊人,天翼云两篇论文被ACM ICPP 2024收录!

天翼云开发者社区
• 阅读 205

近日,由天翼云科技有限公司弹性计算产品线天玑实验室撰写的两篇论文《PheCon: Fine-Grained VM Consolidation with Nimble Resource Defragmentation in Public Cloud Platforms》及《Yggdrasil: Reducing Network I/O Tax with (CXL-Based) Distributed Shared Memory》被ACM International Conference on Parallel Processing(ICPP)收录。

“翼”鸣惊人,天翼云两篇论文被ACM ICPP 2024收录!

ACM ICPP是计算机体系结构、并行与分布计算、存储系统领域的顶级会议之一,也是世界上最古老的连续举办的并行计算国际会议之一。ACM ICPP收录论文均经过严格的同行双盲评审,近五年平均接收率为27.9%。此次天玑实验室两篇论文的成功收录,既是顶级权威机构对天翼云技术创新能力的认可,也是中国企业在国际学术舞台影响力日益增强的有力证明。

本次收录的两篇论文分别阐述了天翼云天玑实验室团队自主设计与研发的两大创新成果,包括面向大规模云数据中心管理的智能资源调度技术——PheCon,和基于“聚合计算”产品理念的面向新一代云计算基础设施的网络I/O加速技术——Yggdrasil。

PheCon:细粒度云数据中心 智能资源碎片整理算法

在云计算场景下,由于数据中心负载水平的波动性和需求的不确定性,各个物理服务器普遍存在资源碎片问题,造成数据中心资源浪费。如图1所示,客户需要紧急开通6台指定规格的云服务器,但集群内剩余资源只能满足4台云服务器,形成典型的资源碎片现象。如何应对资源扩容中常见的周期长、成本高等挑战,满足极端场景下的客户需求,成为亟需解决的难题。

“翼”鸣惊人,天翼云两篇论文被ACM ICPP 2024收录! “翼”鸣惊人,天翼云两篇论文被ACM ICPP 2024收录! 图1. 碎片整理示意图

本论文创新性提出一种新型细粒度碎片整理算法——PheCon,通过云服务器二次调度的方式聚合集群内资源碎片,以满足更大规格资源的开通需求。同时,该论文还提出了基于分治思想的NUMA感知启发式算法和“诱导迁移”(Induced Migration)技术,通过规格填充、物理服务器选择、云服务器排序和NUMA调度,实现集群布局优化。

基于上述技术特点,PheCon可适配天翼云“2+4+31+X”的资源布局和异构数据中心的异构资源特点,做到一池一算、算无遗策,满足全域异构资源的二次调度,实现分钟级的快速碎片整理,提供优质的上云体验。目前,天玑智能调度平台稳定运行PheCon碎片整理功能,累计提供服务72次,每年节省运营成本超过千万元,减少碳排放超百吨。

Yggdrasil:CXL使能的无感 网络I/O性能加速

在通信密集型应用程序的运行过程中,基于Linux内核的操作系统网络通讯组件面临巨大的运行负担。为有效解决上述问题,本论文提出Yggdrasil网络通讯平替方案。

Yggdrasil是天翼云聚合计算团队预研的下一代数据中心网络通信技术。如图2所示,该技术可基于CXL共享内存实现用户态的高性能TCP/IP通信,且完全兼容现有的socket API,无需修改代码即可完成性能加速。天玑实验室团队通过模拟和真实CXL硬件进行评估的结果表明,Yggdrasil 可使Memcached的吞吐性能相比传统Linux socket高出8.2倍,并在不同消息大小的微基准测试中,将通讯延迟降低到传统方式的0.3%到4.1%。

“翼”鸣惊人,天翼云两篇论文被ACM ICPP 2024收录! 图2. 关于Yggdrasil快速/慢速通信路径示意图

Yggdrasil的性能优势与易用性主要得益于三个方面的设计优化

(1)在跨主机通信中,Yggdrasil采用基于CXL的分布式共享内存(即快速通信路径)以提升性能,在CXL不可用的情况下,自动无感切换回传统socket(即慢速通信路径)。

(2)Yggdrasil依托于受信任的用户空间监控守护进程管理通讯连接控制平面操作,减少上下文切换开销。数据平面采用对等模型进行跨物理主机的进程间通信,充分利用CXL共享内存的性能优势。

(3)为弥补socket API和共享内存之间的语义鸿沟,采取多种技术兼顾接口兼容性和性能优势。

基于Yggdrasil的I/O网络性能优势及良好的API接口兼容性,Yggdrasil方案将在天翼云弹性计算产品线自主设计和研发的聚合计算平台进行落地,以减少网络I/O税,从而为客户提供更澎湃的算力资源,助力千行百业创造更多价值。

面向未来,天翼云将继续加强关键核心技术自主攻关,以领先的产品能力夯实数字基础设施底座,为千行百业数字化转型保驾护航。

点赞
收藏
评论区
推荐文章
畅享高性能计算!天翼云HPC解决方案来了
6月15日,“天翼云HPC解决方案加速企业数字化转型”专题讲座在线上召开,天翼云科技有限公司高级解决方案经理梁小彪、天翼云科技有限公司高级工程师孙晓宁作为主讲人,分别对天翼云HPC解决方案及应用、天翼云高性能计算产品做了分享。在十四五规划与双碳目标的驱使下,高性能计算的技术研发越来越重视低碳减耗。随着互联网应用场景不断拓展,数据流量爆发式增长,企业对高性能
天翼云携手华为,强强联合,共创数据存储新生态
6月24日,天翼云&华为联合创新中心揭牌仪式在蓉举行,双方将凝聚力量,共同探索基于数据存储的应用发展与创新,推动数据存储实现跨越式发展。此次会议标志着天翼云与华为在数据存储联合创新合作上,迈出了实质性和关键性的一步。天翼云科技有限公司总经理胡志强、华为数据存储产品线总裁周跃峰出席仪式并发表致辞。会上,天翼云科技有限公司研发三部副总经理黄润怀、华为闪存存储领域
天翼云4.0来了!千城万池,无所不至!
国际数字科技展暨天翼智能生态博览会天翼云论坛在广州举办。大会现场天翼云推出了全新品牌形象,对全面升级的天翼云4.0分布式云进行详细解读。中国电信集团有限公司副总经理唐珂与天翼云科技有限公司总经理胡志强共同进行天翼云品牌的升级发布。 中国电信集团有限公司副总经理唐珂发表致辞,他指出,天翼云全面升级到天翼云4.0,实现了一云多态、一云多芯、一张云网、一致架构、统
“视界”尽在眼前,海纳视联大模型来了!
11月10日—13日,以“数字科技焕新启航”为主题的2023数字科技生态大会在广州举办。会议期间,在数字生活与天翼视联合作论坛上,重磅发布了由天翼云科技有限公司、天翼数字生活科技有限公司和天翼视联科技有限公司联合研发的视联行业大模型——海纳视联大模型,为视联行业智能化发展按下加速键。
彰显科技硬实力!天翼云论文在国际顶刊JoCCASA发表!
近日,由天翼云科技有限公司云网产品事业部混合云团队完成的论文《MultivariateTimeSeriesCollaborativeCompressionforMonitoringSystemsinSecuringCloudbasedDigitalTwin》在云计算领域国际知名学术期刊JournalofCloudComputing:Advances,SystemsandApplications(JoCCASA)发表。
再获权威认可!天翼云论文被IEEE/ACM CCGrid收录
近日,由天翼云弹性网络开拓者团队撰写的《TowardsBetterQoSandLowerCostsofP4EIPGatewayattheEdge》论文被The24thIEEE/ACMInternationalSymposiumonCluster,Cloud,andInternetComputing (CCGrid2024) 长文收录。
三项国际人工智能顶会大奖!拿下!
近日,国际人工智能顶会CVPR 2024举办的第6届自然场景情感行为分析挑战赛(6thWorkshopandCompetitiononAffectiveBehaviorAnalysisinthewild,简称ABAW)公布比赛结果,天翼云AI团队(CtyunAI)在情感识别任务中表现出色,斩获双赛道亚军、单个赛道季军,并受邀在CVPRABAW研讨会上作论文分享。这是继天翼云在CVPR中荣获多次佳绩后再一次斩获殊荣。
登上国际舞台!天翼云P4 EIP网关流量管理创新方案亮相CCGrid 2024!
5月8日,第24届IEEE/ACM集群、云和互联网计算国际研讨会(CCGrid2024)在美国费城隆重举行。来自中国、美国、印度、法国等国家的学术及产业界代表齐聚一堂,围绕云计算相关议题进行深入探讨和交流,并带来最前沿的技术展示。天翼云云网产品事业部弹性网络产品线总监侯叶飞出席大会硬件系统和网络分论坛,对本次被CCGrid长文收录的论文《TowardsBetterQoSandLowerCostsofP4EIPGatewayattheEdge》进行专业解析,并分享了天翼云在开放数据中心网络及可编程网关领域的创新与实践经验,再次彰显了天翼云的技术创新实力。
行业标准引领者!天翼云助推智算领域规范化发展!
7月24日,2024可信云大会召开期间,智算云服务论坛上,天翼云荣获中国信通院颁发的“智算工程平台能力要求标准参编证书”,代表了业界对天翼云在推动行业标准制定中所作贡献及成果的重要肯定,以及对天翼云技术创新水平的高度认可。会上,天翼云科技有限公司智算产品线资深技术专家瞿龙发表演讲,介绍了天翼云智算平台加速大模型应用方面的技术亮点与成功案例。
国际“论”剑!天翼云数据库论文被EDBT收录!
近日,由天翼云数据库团队、中国电信云计算研究院和深圳北理莫斯科大学合作完成的《Taste:TowardsPracticalDeepLearningbasedApproachesforSemanticTypeDetectionintheCloud》(构建云上基于深度学习的大规模语义类型识别系统)论文被28thInternationalConferenceonExtendingDatabaseTechnology(EDBT)长文收录。
天翼云开发者社区
天翼云开发者社区
Lv1
天翼云是中国电信倾力打造的云服务品牌,致力于成为领先的云计算服务提供商。提供云主机、CDN、云电脑、大数据及AI等全线产品和场景化解决方案。
文章
696
粉丝
15
获赞
40