我在618主场,和3位顶尖技术博士聊了聊

京东云开发者
• 阅读 0

How time flies!又到了一年一度的618。

今年你下单了吗?抢到心仪的商品了吗?快递收得顺利不?血拼了大半个月的我有一个最大的体会,就是今年的618还是那么热闹,但有些东西变了。

你可能也注意到这些变化——

商品推荐越来越命中心趴,物流越来越快,甚至智能外呼、客服机器人,也越来越像个真人了。

技术不是“内卷”“压榨”或“花样叙事”的工具,而是切实服务着美好生活。

体验更好,出错更少,意味着背后的技术进步得更多,也越能说明有人在背后顶住了压力。

让大家高高兴兴购物,支撑亿级用户顺利下单、收货体验的,是一群技术人,他们日复一日地在代码堆里打磨系统、调模型、压成本、提效率。

我在618主场,和3位顶尖技术博士聊了聊

618是京东的生日,也是京东首次以线上促销形式庆祝这一日期,推出了618年中促销活动,通过限时秒杀等简单玩法吸引消费者。

一眨眼,我们已经在这个特别的时间点买买买了二十多年。

趁着这个节点,今年,我们找来了三位分别来自京东零售、物流、科技业务的技术人,聊了聊他们在幕后做的事

长林丨零售:不是造一个新模型,而是让模型用得起、落得下

大家在京东选购商品时可能会留意到,不同商家架上的同类商品会自动被归在一起,方便大家快速对比选购性价比高的商品,商家也会被激励提供更具竞争力的价格和服务。

这背后其实是一套“同品判别系统”, 它通过对比商品的各种属性来判断两个商品是否相同,同时保证聚合展示的质量

我在618主场,和3位顶尖技术博士聊了聊

来自京东零售业务的长林,正在主导京东同品判别系统在大模型时代的优化。

他2021年从中国科学院自动化研究所博士毕业加入京东,一开始就在做大模型相关的工作。最开始是研究BERT等,case by case地简单修改模型架构、改造模型训练方式。 我在618主场,和3位顶尖技术博士聊了聊

读书时期长林和行业大佬交流

后来ChatGPT横空出世,他的研究就主要集中在模型压缩和数据自动化选择与配比上,尽可能提高模型训推效率和性能平衡,减少实际应用中的人力和实验成本。

在京东这样一个SKU数量以亿计、电商业务极其复杂的平台上,要让系统自动识别出相同商品,既要精度高,还得成本可控、能大规模运行——难。就连大模型中很“小”的7B模型,使用起来都成本太高、速度太慢,难以支撑实际业务的规模化落地。

于是,长林和团队决定转向一条更务实的路线,即模型蒸馏

小模型学习大模型分辨的结果对错,也学习其内部思考过程,领悟判断逻辑,深入理解什么样的特征才是有用的判断依据。

最终,长林和团队把大模型的推理过程抽象成特征动态演化的过程,从而最大程度提取知识。相关成果最后被顶会ACL接收。

模型蒸馏外,数据是长林一直关注的另一要素

在模型训练阶段,京东平台上海量商品之间的组合数量指数级增长,不可能全部喂给模型用来训练。

为此,长林设计了一套数据筛选机制,优先选出那些最有信息量、最难判断的“模糊样本”,这样不仅节省了40%~60%的训练资源,还保持了原有精度。

同时,为了支持多个任务的数据融合训练,他还引入了一种自动数据配比算法,根据不同任务的难度动态调整数据占比,进一步提升了训练效率。

以上这一整套方法,最后被用在系统审核环节。

我在618主场,和3位顶尖技术博士聊了聊

长林代表公司参加行业顶会

幸运的是,这种算力消耗不低的探索方向,在系统真正被验证好用之前,就得到了京东在资源和团队协作上的支持

这种在项目推进上的自由度,让长林能够坚持自己的追求——不是堆模型参数赢比赛,而是让技术真正跑进业务、服务用户。如果能让用户更快买到“又好又便宜”的商品,提升一点点体验,降低一点点选择成本,那技术就没白用。

技术人要找到值得长期投入的课题,关键不是一头扎进算法细节,而是要深入业务,从实际问题角度出发。

而京东与其他电商平台不同,它拥有完整的供应链体系。

京东对于供应链全流程包括需求预测、采购/供应、仓储/库存、销售、物流履约和客服都有深刻的理解。同时又拥有自营和POP两种完全不同的模式。这会带来很多全新的机会。

“但对技术人来说也是一个挑战。”长林表示,这意味着需要在更大的搜索空间里寻优,需要更好的优化方法。

像他做的同品判别系统,就是在深入理解商品聚合场景之后,自然浮现出来的方向——既贴近用户体验,又具备模型落地的复杂性,值得长期深耕。

这就是技术真正的影响力,不是靠炫技,而是让科技以「无感」的姿态融入日常,让用户体验丝滑流畅

长林非常鼓励更多年轻的技术同学关注这个方向,“这块未来机会很多,也值得用心去深挖。”

星衍丨物流:打透一个场景,不去追求无边界泛化

和长林差不多时间入职京东的星衍,如今已经是京东物流一个10余人技术团队的负责人了

我在618主场,和3位顶尖技术博士聊了聊

读书时期的星衍

此次618物流大考前夕,星衍的日常有些“不太日常”:他带着团队每隔几小时就查看一次前线实仓的指标、现场监控和异常回报,有时还要一起亲自到实仓去。

因为他和团队面临的工程问题,80%需要现场给出的答案。

至于他为什么会选择今天这条路,故事还要从他当年在国外读博说起。

当时,星衍在Meta实习,也顺利拿到了研究岗的offer。但“那个岗位其实做的就是写SQL、跑数仓,和博士研究的时空数据分析基本没关系”,而且在星衍看来,国外平台对技术人员的上限不够友好,是不是博士干的活都差不多,没啥挑战。

我在618主场,和3位顶尖技术博士聊了聊

思来想去,他还是决定回国。

在横向对比了N个到手offer后,星衍决定成为一名京东人。原因很简单:

至少这里的业务场景是开放的,你想往前多做一步,是有空间的。

最终,结合自己的专业方向和技术兴趣,他选定了京东物流作为定岗方向——这是一个看起来“灰尘多、线下多、数据脏”的场景,并且是需要真正的深入业务理解业务场景,在一线、成为一线。

他每天需要考虑和接触得最多的,不是派送件的快递员,就是分拣快递的仓库。这俩一个是物流末端,面对开放环境,一个是封闭场景,复杂度不在一个纬度上,但都不简单。

星衍主导的第一个项目,是对快递终端作业模式进行重构

以前,每个京东快递的站点,是站长靠经验来划分快递员辖区。随着快递体量越来越大,人的主观经验开始吃不消了——既有分配不均的问题,也有反馈难追踪的问题。

他印象特别深,当时做末端派送分析就发现,有的快递员明明在同一个小区送件,却要回到站点两三次。

于是,星衍带领团队开发了一套智能分区模型,结合快递员画像 (如派件量、上楼频率、返站次数) 和小区地形信息 (是否老旧小区、有无电梯等) ,帮助末端更合理地分派人力。

时至今日,京东物流仍然在不断探索如何更好地利用数据进行优化和改进。

而星衍现在正在推动的项目,是部署在京东物流的分拣中心的机械臂,这也是为什么他最近忙得不可开交、动辄要去仓库前线的原因。

我在618主场,和3位顶尖技术博士聊了聊

星衍在一线

从去年开始,星衍带队负责包裹抓取与码放的智能化改造项目,落实到地就是一台台机械臂,负责完成京东仓库中部分中小件包裹的自动分拣、码放工作。

这些机械臂和传统工厂流水线上的机械臂不同,它们是“具身智能”,只不过不是通用型的。而它们和星衍团队的目标,是把“中小件包裹分拣、码放”这个单一场景打透

为什么要强调“打透”?星衍强调,越垂直的场景,越不能追求泛化,而且这一个场景其实比想象中难太多。

“包裹没你想得那么规整,包裹外包装有反光的、黑的,也有两个胶带粘一起的,尺寸大小也不一致。”星衍介绍道,“有一次机械臂遇到一批包裹中间贴了反光胶带,系统误以为那是两个包裹,就导致识别错误。”

具体技术上,星衍团队采用了行业成熟方案加域内微调的模式。这种情况下京东内部积累的海量包裹图像数据就立下了汗马功劳,这都是外部团队很难获得的积累

与此同时,星衍团队还开发了一套反馈机制,一旦发现识别失败的样本,就能快速回流重新标注进入模型训练闭环。

作为博士管培生入职后,他从初来乍到的技术新人,到现在带着团队伙伴一起负责核心项目,星衍的成长速度是非常快速的,角色的转型也是他近期的重要课题。

以前是自己调模型、改代码就行,现在是得替大家考虑怎么组织项目、解决问题。如今的星衍,比起一开始那个还带着研究视角的博士,显然多了一些“工程老兵”的理性与判断。

我在618主场,和3位顶尖技术博士聊了聊

具体的带团队方法上,他比较反感“压KPI”的做法,更强调问题导向、协作为主。

团队项目一旦出了bug绝不推诿,遇到问题大家就挤在会议室一起想办法,“没什么面子不面子的,干活是最实在的。”

初雪丨科技:识别准了才算数,“我们自己能做得更好”

语音识别这个技术活,是初雪每天都在打交道的工作

作为京东科技的一员,他参与的语音识别系统,已经深度接入了京东的协同办公、智能客服、AI外呼、语音搜索、具身智能等多个核心业务线。这些业务大家其实早就体验过。

当初刚刚加入京东的时候,技术小兵初雪只是参与着科技业务一些比较底层的小模块的开发调试,比如语音活动检测、VAD、声纹日志。

乍一听这些技术非常陌生,但其实在消费者每天都接触到的应用里,都是链路里不可或缺的模块

扎实的经历,让初雪在短短几年中从小模块爬到了大项目——不仅在京东语音能力大项目中担任研发骨干,还开始牵头组内一些新方向的探索和项目落地。像智能外呼系统、远场识别模型、智能客服的语音前端能力,他都参与了完整的方案设计与技术实现。

这些应用,在京东丰富的自有场景里迅速扎根,成长为有成千上万用户、身边朋友家人都会用到的产品。这让初雪从初入行业的技术人才,进化成熟稔产业应用的专家。

我在618主场,和3位顶尖技术博士聊了聊

初雪(右起第四)和伙伴们一起保障春晚红包互动

当聊到这段成长经历,初雪表示自己“晋级打怪”的速度不是个例。

他当初经由博士管培生项目招进京东,项目机制成熟:入职前半年打基础,技术大佬+业务大佬直接指导,解答技术问题的同时能够深入业务学习和建立认知,接下来就会进入项目历练,在能落地的技术实践中培养人才,利用技术眼界创造更大的价值。因为每个人都配备了导师,每个人都有清晰的成长路径。

我在618主场,和3位顶尖技术博士聊了聊

京东在资源上也很支持,“项目落地过程中,只要你能把技术说清楚、效果做出来,公司就愿意投入。京东是一家用产业价值衡量技术的企业。”

当初选择加入京东,除了项目机制成熟,公司资源倾斜,专业方向匹配 (他本就是做语音识别方向的博士) ,还有很现实的考虑:一是初雪是北方人,在北方城市生活更习惯;二是京东福利实在,自己在北京落了户,身边还有很多同事通过公司住房保障基金在北京买房安了家。

当然,真正让他成长跳跃的,还是他在真实业务场景拼杀、口中“打仗一样”的项目经历

初雪回忆道,某年他所在团队揽下了做会议转写系统的任务,但当时市面上已经有成熟产品了,公司内部一直有声音主张直接对外采买。但京东既坐拥丰富的产业数据,又拥有大量的场景需求。当时初雪就觉得,如果这都做不过外部竞品,那我们还有什么价值呢?

于是,他和团队一路从底层模块开始优化,从ASR(自动语音识别)、说话人识别、VAD,一直迭代到后处理文本修复,花了几月时间反复打磨。

最后在多轮盲测中,自研的会议系统转写效果超过了外部头部竞品。

我在618主场,和3位顶尖技术博士聊了聊

初雪(右起第六)项目上线后和伙伴们一起庆祝

接下来,初雪进入了更多集团级项目的核心链路中,“资源多,场景也多。” 他开始站在京东更高的视野考量技术的价值。

现在他主攻的两个方向是声纹识别和远场语音识别。

应用到京东的业务场景中,咱们普通人最有感知的例子或许是京东智能外呼——电话那头听起来很自然、反应灵活的拟人语音,高效处理海量呼叫任务,介绍最新产品、活动,还能理解客户需求。

其实,接电话人常常说的是方言,哪怕是普通话也带有很重的口音,会严重影响模型识别准确率。

我在618主场,和3位顶尖技术博士聊了聊

针对这个必须解决的问题,初雪和团队专门收集了全国各地的大量样本,还开发了针对性增强机制,比如使用MoE来在不同方言分布之间做切换,从而实现对口音更友好的模型泛化。

除了这些,他也在推动一些更“感知层”的创新方向,比如通过分析语音中的情感、语气波动,判断用户的意图倾向是“犹豫偏正向”还是“犹豫偏负向”。

你不能只看他说了什么,还得听他说话的“感觉”。 这些看似天马行空的技术,对于外呼电话能否打动听众、品牌能否真正有效触达消费者,有着生死攸关的商业价值。

目前,这个方向还处在探索期,但初雪相信未来一定会进入更多业务环节,因为“这才是真正让AI听懂人话”

当被问到对这份工作的认同感时,初雪停顿了一下,然后说:

语音识别是个感知特别强的技术,识别对了没什么人夸你,识别错了,用户第一时间就知道。因为用户对人讲话太熟悉了。最常用的技术应用,也是最难做的。
我现在做的,就是让错的地方越来越少,让听不懂的情况越来越少。让用户在无感知的情况下,就能享受到技术的价值。

从TGT出发,走一条真正属于技术人的长路

长林、星衍、初雪三位技术人业务方向各不相同,但聊天过程中,他们不约而同地提到了同样的关键词:

“踏实” “敢为”

这是他们仨对京东技术风格的形容词

在他们看来,京东的技术风格没有太多“花活”,但正因为扎实,才适合做长期的事。

这种风格背后,其实也离不开对人才的持续投入。三位同学都提到,自己在入职初期能快速上手,很大程度得益于导师和前辈的“带一把”

不仅有专门的技术导师带着解决具体问题,也有不少学长学姐、业务负责人愿意一起拆需求、跑现场、推项目。就像长林说的那样,“你不是被扔进来自己摸索,而是真的有人和你并肩一起走。”

京东对技术人的重视,从来不只是拿来用好,更是长期养好

而在技术人才培养这件事上,京东今年又往前迈了一大步。

今年5月,京东正式推出了TGT计划(Tech Genius Team,顶尖青年技术天才计划),面向全球招募毕业两年内的硕博技术人才,同时也向有算法竞赛或顶会论文等硬实力的优秀本科生开放。

只要你在AI、大模型、机器人、推荐系统等方向具备足够的科研潜力,TGT都为你打开了通道。

与传统校招不同,TGT在培养机制、激励制度上都做了不少“破框”

比如,薪资不设上限,真正以能力和潜力定薪;又比如,配套设立了“三导师制”,技术导师指导科研突破,业务导师帮你打通落地路径,成长导师陪你梳理职业规划;还有专属的场景资源与算力支持,你做的每个算法实验、每次模型迭代,都有真实数据支撑、真实问题反馈。

在技术练兵这件事上,京东天然有巨大的场景优势。海量电商数据、物流网络、金融风控场景……这些构成了一个庞大、完整、真实的技术应用生态。

你可以在这里调系统、跑实验、出论文,也可以直接上线服务千万用户——从0到1的基础研究、从1到100的规模部署,整个链路你都能看见。

我在618主场,和3位顶尖技术博士聊了聊

京东技术沙龙

TGT计划只是一个起点。

对技术人来说,真正重要的,是站到真实问题中去。

就像星衍对我们说的:“在京东,不是等你研究好了再找应用场景,而是边研究、边落地,心向星辰大海,也踏实走好脚下的每一步。”

此次我们接触的三位同学分属不同业务线,参加工作后每天经历的挑战也各不相同,但他们都在话语间透露出这样一个信息:

都想找一个值得一做再做的事情。

说起来,京东这三位同学都是屏幕前你我的同龄人,要说有什么不同,就是他们一路上坚定地选了那个自己更想尝试的方向。

这样的工作状态也没什么主角光环加持。但找到这么一个地方,确实需要一点运气

幸运的是,他们刚好找到了一个能做事,也能被看见的地方。

点赞
收藏
评论区
推荐文章
学python的猫 学python的猫
4年前
618抢购抢不到?,会了python的这个骚操作,妈妈再也不担心我抢不过别人了!!!
618马上要到了,像淘宝,天猫,京东早就已经准备好了,每到618与双十一这种消费盛典,便会抢购的现象,很多人因为手速不够快,抢不到价格实惠的商品,在这小编给大家带来了一个自动抢购的示例代码,此代码是python通过selenium实现毫秒级的自动抢购。(该文章仅作学习selenium框架的学习示例)直接上源码:!/usr/bin/envpythoncod
海军 海军
4年前
2021前端技术面试必备Vue:(一)基础快速学习篇
由于疫情的影响,相信很多小伙伴都在家里待着。中小公司由于运营困难会出现裁员,我们也面临着'失业',你是否感到了焦虑.最近做了个调研:'现在的你找到工作了吗?<br/1.大部分的回复:求职平台都是‘已回复’,然后没有下文,你遇到了吗?<br/2.各个公司对技术的要求增高<br/3.有人说开始搞副业<br/在我来看,这一年已经过去了四分
不是海碗 不是海碗
2年前
快递物流查询API有什么作用?
随着电商的发展,如今网上购物的人越来越多,频率越来越高,不用出门就能买到自己想要的东西。商品下了单之后商品怎么到自己的手上呢?这就离不开快递和物流了,商家把商品给到快递和物流服务商,快递和物流服务商则把商品运输并配送到我们的手上。除了电商行业之外,在我们生活、工作中处处也离不开快递物流。爸妈给出门在外的子女寄东西需要快递物流;去某个地方,东西太重了不好随身携带,可以寄快递物流送过去;两个公司之间纸质合同、文件、发票寄送也需要走快递物流等等,很多很多地方我们都需要用到快递物流,它也方便了我们的生活、工作。
Wesley13 Wesley13
3年前
PHP代码审计入门笔记合集(共20篇)
早安,我的朋友们。今天是11月20号,离2021年只41天了,今年你的小目标完成了吗?跟大家分享件事情,其实这几个月来,我一直在准备一场考试,值得高兴的是,就在前两天终于顺利通过CISSP考试,完成了今年的小目标。比起考试通过,似乎很久没有那种专注于想要完成一件事的心情和体验,我只想说,重新捡起丢失掉的专注力的感觉真好。另外,今天分
Stella981 Stella981
3年前
OSChina 周三乱弹 —— 爆竹声声辞旧岁(多图)
周三,今天就是除夕啦,鞭炮放起来,俗话说,爆竹声声岁岁除,瑞雪飘飘兆丰年。今天你放炮了吗?嘿嘿今年的最后一天,新年计划都做好了吗?小小编新年计划就是能年轻个十几二十岁的,大家都说年少无烦恼~相信很多OSCer的计划都是新年要准备买车买房,把漂亮媳妇娶回家,美美的过日子~车都选好了吗?广告还是可以看看,车的广告算是很
为什么mysql不推荐使用雪花ID作为主键
作者:毛辰飞背景在mysql中设计表的时候,mysql官方推荐不要使用uuid或者不连续不重复的雪花id(long形且唯一),而是推荐连续自增的主键id,官方的推荐是auto_increment,那么为什么不建议采用uuid,使用uuid究
不是海碗 不是海碗
1年前
如何在购物 App 上实现商品快递物流信息的展示
现如今,人们大多数会选择在手机购物App上进行购物,这样买东西很是便捷,不用出门就能买到全国各地甚至是国外的商品,下单之后只需要等待快递送达就可以了。一个购物APP,不可或缺的一个辅助功能就是,展示商品的物流信息,这样用户就能看到自己买的东西到达哪里了。
ChatGPT的探索与实践-业务应用篇 | 京东云技术团队
本篇文章主要介绍在实际的开发过程当中,如何使用GPT帮助开发,优化流程,恰逢今年京东20周年庆,文末会介绍如何与618大促实际的业务相结合,来提升应用价值。全是干货,且本文所有代码和脚本都是利用GPT生成的,请放心食用。
京东云开发者 京东云开发者
11个月前
大模型再加速,保障京东618又便宜又好
在这背后,京东云作为京东618的技术基石,以技术创新降低数字基础设施成本,将大模型等智能技术贯穿业务全流程,实现自身和伙伴的降本增效,以真降本保障真低价。京东云言犀大模型助力京东618数字基础设施持续降本,混合多云操作系统云舰、分布式存储平台云海、软硬一体
关税战按下暂停键!618 大促撞上减税窗口,反向海淘党正在疯狂「拼单」捡漏-运费平摊 + 关税减免,中国好物跨洋秒变「白菜价」
​各位参与拼邮的小伙伴请注意啦!5月22日就是截单打包发货的最后期限,5月23日及之后到达的商品就要等待下一批次的运输安排了。身在纽约曼哈顿公寓的小美,看到群里这条消息后心里顿时紧张起来,赶忙打开淘宝APP,查看自己在618大促期间抢购的17件商品物流状态