DeepSpeed: 大模型训练框架 | 京东云技术团队
目前,大模型的发展已经非常火热,关于大模型的训练、微调也是各个公司重点关注方向。但是大模型训练的痛点是模型参数过大,动辄上百亿,如果单靠单个GPU来完成训练基本不可能。所以需要多卡或者分布式训练来完成这项工作。
京东云开发者 京东云开发者
10个月前
供应链大屏设计实践
概述在物流系统相关的大屏中,供应链大屏复杂度较高,数据链路较长,稳定性要求较高,当前大屏已经经过2年时间的打磨,整体表现已经相对比较成熟稳定。本文描述了物流供应链业务较复杂的业务场景下,结合了大数据计算相关技术,总结了实时监控大屏指标建设和服务构建的框架和
京东云开发者 京东云开发者
6个月前
简述大前端技术栈的渲染原理
作者:京东物流卢旭大前端包括哪些技术栈大前端指的是涵盖所有与前端开发相关的技术和平台,应用于各类设备和操作系统上。大前端不仅包括Web开发,还包括移动端开发和跨平台应用开发,具体包括:•原生应用开发:Android、iOS、鸿蒙(HarmonyOS)等;•
京东云开发者 京东云开发者
1个月前
供应链大屏设计实践
作者:京东物流郑冰概述在物流系统相关的大屏中,供应链大屏复杂度较高,数据链路较长,稳定性要求较高,当前大屏已经经过2年时间的打磨,整体表现已经相对比较成熟稳定。本文描述了物流供应链业务较复杂的业务场景下,结合了大数据计算相关技术,总结了实时监控大屏指标建设
近屿智能 近屿智能
1星期前
小米开源“Xiaomi MiMo”模型,近屿智能带你系统掌握AI大模型应用
近期,小米大模型团队通过“XiaomiMiMo”官方公众号发布重磅消息,宣布成立专注推理能力的大模型核心研发团队,并正式推出首款自研大模型XiaomiMiMo,同时实现全面开源。作为一个参数仅为7B的小体量模型,MiMo在数学推理测评集AIME2425及代