GAITC2025|张科:端云一体大模型推理应用实战

京东云开发者
• 阅读 0

期,2025全球人工智能技术大会(GAITC2025)于杭州盛大开幕,汇聚全球顶尖科学家、技术领袖及行业先锋,共同探讨人工智能技术产业化新趋势。京东零售AI Infra &大数据计算负责人张科受邀出席并在《行业大模型应用与发展》论坛发表演讲,首次深入介绍京东零售在端云一体大模型推理架构的实战经验与技术探索,并分享AI推理方向的未来发展思考。以下为张科分享实录,内容经编辑略有删减: GAITC2025|张科:端云一体大模型推理应用实战

大模型技术突飞猛进,大模型不仅是算法和算力的集合体,更是产业智能化的新底座,正在推动AI从“可用”向“好用、可控、可信”迈进。电商场景作为AI技术的应用场,逐步形成了三个主要的需求方向:Generative AI(如AI生成商品图、短视频、AI营销内容生成、AI数字人)、Agentic AI(如AI客服与售后管理、AI经营托管、AI仓配优化 、AI交互式推荐)、Physical AI(如自动分拣机器人、智能空间、自动驾驶)。在复杂场景与多元需求的驱动下,AI推理正面临一系列技术挑战,包括输入类型多样、用户需求优先级不同;端(如手机)和云(服务器)之间任务分配难、协同优化难;模型压缩和性能优化等问题。

京东零售联合清华大学推出 xLLM 端云一体大模型推理架构

2022年起,京东与清华大学开启深度合作,在计算机视觉、机器学习、推荐系统、大数据等领域联合开展了十余项课题研究。今年双方进一步拓展合作边界,新增大模型推理引擎国产化、多模态推荐大模型等前沿方向,聚焦整合技术资源与学术优势,共同探索前沿技术创新,推动科研成果向实际生产力转化。自今年初大模型推理引擎国产化合作开展以来,京东零售和清华大学一起在大模型量化压缩、端-云协同推理引擎等方向联合攻坚,并提出“xLLM 端云一体大模型推理架构”,以解决推理引擎的性能优化问题、助力大模型技术在复杂电商环境的规模化落地。通过端云联合部署,实现高效协同推理。利用终端用户数据和反馈,云端模型持续优化并实时更新终端轻量化模型,形成闭环进化系统,提高模型在实际场景中的性能。该架构还可适应不同终端设备资源限制,实现大模型更广泛复用。 xLLM端云一体大模型推理架构中的技术探索还表现在以下4个方面:1.自适应调度优化:动态调整Prefill与Decode节点比例,实现动态的自适应弹性PD能力。2.在离线统一调度:根据负载实时调度在离线请求,实现请求级别的在离线混部的能力。3.多层流水线执行:最大化资源利用率,通过调度和模型执行异步流水线、不同Layer的计算和通信异步流水线、不同计算单元、访存并行流水线的多层流水线执行。4.端云Agent协同:端Agent处理简单任务与隐私数据,云 Agent 不断反馈优化,提升端 Agent 能力,并基于高效 Agent 协议协同。目前该推理架构已经在内部多个场景应用,在可交互式导购、商品对比、商品总结、购物建议等环节,大幅提升了响应速度,节省了计算成本,同时还有效助力了用户的活跃度。在核心的商品理解环节,也有效提升了大模型的理解能力和信息处理能力,模型推理成本最高可节省70%。 GAITC2025|张科:端云一体大模型推理应用实战

AI推理方向的未来思考

在现有技术探索的基础上,未来京东还将持续加大对国产 AI 基础设施的投入力度,着力构筑自主可控的技术生态体系。京东将重点聚焦三大前沿方向展开深入研究:破解规模、效率、成本的 “不可能三角”、推进(端云)多智能体异步自进化、端云分布式推理的可解释和可调试。通过上述布局,京东希望逐步实现主流国产芯片的深度适配优化,并基于自主研发的大模型推理框架,推动技术效率达到国际先进水平。也希望和业界同行共探技术边界、一起前行。

GAITC2025|张科:端云一体大模型推理应用实战

点赞
收藏
评论区
推荐文章
Wesley13 Wesley13
3年前
4项探索+4项实践,带你了解华为云视觉预训练研发技术
摘要:本文主要讲述云原生时代华为云在AI基础研究、视觉预训练模型研发和行业实践,以及AI开发平台ModelArts的最新进展。近日,在Qcon全球软件开发大会(深圳站)上,华为云人工智能领域首席科学家、IEEEFELLOW田奇博士,发表了“云原生时代,视觉预训练大模型探索与实践”的主题演讲,介绍了云原生时代华为云在AI基础研究、视觉预训练模
天翼云加码边缘计算,让普惠算力触手可及!
8月25日,亚太内容分发大会暨CDN峰会在京召开。大会汇集CDN产业领军企业,聚焦产业前沿科技突破,共同探讨边缘计算发展趋势与创新应用。天翼云科技有限公司高级研发经理张其栋出席“边缘计算论坛”并发表主题演讲,分享了天翼云边缘计算的发展规划与实践案例。天翼云科技有限公司高级研发经理张其栋当前,边缘计算发展势头强劲,Gartner预计到2025年将有超过75%的
2023京东全球科技探索者大会暨京东云峰会来了!
大模型开启AI新范式,AIGC掀起行业新浪潮。“2023京东全球科技探索者大会暨京东云峰会”,将于7月13日在北京举办。本次大会,以“跨越·产业智能”为主题,聚焦大模型与产业深度融合,将重磅发布京东大模型,推出新一代数字基础设施,升级产品及解决方案,致力于
直播预告 | 大模型时代 “应用变了”:看大模型如何跑进零售电商应用
走进零售电商,大模型能做什么?今年11.11,应用大模型带来成效显著今天下午2:00,京东云视频号准时直播看京东零售如何破题新解法,大小模型协同大模型将走向多模态,走向具身智能
迎接智算新挑战,天翼云亮相全球架构师峰会!
近日,ArchSummit全球架构师峰会在深圳隆重开幕,本次大会以“智能进阶.架构重塑”为主题,探讨AI浪潮下,企业架构如何适应大模型和云原生的时代趋势,寻找既有应用成果又有成本效益的解决方案。国内外100余名顶尖专家齐聚一堂,围绕AI、大模型、云原生等话题展开深度交流。天翼云云网产品事业部研发专家黄坚受邀参会,并在“智算平台建设与应用实践”专题会上发表主题演讲,分享了天翼云在超大规模智算集群运维及管理方面的创新思路和实践经验。
京东云开发者 京东云开发者
8个月前
【转载】把大模型做实 把供应链做透: 京东推出言犀大模型
作者:张东7月13日,2023京东全球科技探索者大会暨京东云峰会在北京举行,全面推出京东言犀大模型、言犀AI开发计算平台、升级支撑大模型落地行业的产品及解决方案,服务千行百业拥抱产业智能。源于产业、服务产业。言犀大模型融合了70%的通用数据与30%京东数智
京东云开发者 京东云开发者
5个月前
2024 京东零售技术年度总结
作者:京东零售零售技术每一次回望,都为了更好地前行。2024年,京东零售技术在全面助力业务发展的同时,在大模型应用、智能供应链、端技术、XR体验等多个方向深入探索。京东APP完成阶段性重要改版,打造“又好又便宜”的优质体验;国补专区快速上线、助力“以旧换新
幂简集成 幂简集成
3星期前
2025年国内AI推理大模型效果对比:DeepSeek、通义千问、腾讯混元
随着人工智能技术的飞速发展,AI推理大模型已经成为各行业关注的焦点。2025年,国内AI推理大模型领域呈现出百家争鸣的态势,其中DeepSeek、通义千问和腾讯混元等模型尤为引人注目。本文将从技术架构、性能表现、应用场景等多个维度对这三款模型进行对比分析。