Stella981 Stella981
3年前
Dubbo网络通讯篇概述
微信公众号:\中间件兴趣圈\作者简介:《RocketMQ技术内幕》作者从本节开始将深入学习Dubbo网络通讯的底层实现细节,在深入学习Dubbo网络模型时,首先应从整体上了解Dubbo的网络通讯模型、线程模型是怎样的?下图是Dubbo官方给出的线程模型:!(https://oscimg.oschina.net/osc
Wesley13 Wesley13
3年前
NLP怪兽GPT
2020年5月底OpenAI发布了有史以来最强的NLP预训练模型GPT3,最大的GPT3模型参数达到了1750亿个参数。论文《LanguageModelsareFewShotLearners》长达74页已发布在arXiv。视频讲解:有网友估算最大的GPT3模型大小大约有700G,这个大小即使OpenAI公开模型,我们一
Stella981 Stella981
3年前
Inflation 引起的 MetaSpace Full GC 问题排查|蚂蚁集团案例分析
1背景本文将用一个蚂蚁集团线上实际案例,分享我们是如何排查由于inflation引起的MetaSpaceFGC问题。蚂蚁集团的智能监控平台深度利用了Spark的能力进行多维度数据聚合,Spark由于其高效、易用、分布式的能力在大数据处理中十分受欢迎。关于智能监控的计算能力相关介绍,可以参考
下载超快!2小时下完DeepSeek !还送算力券!!
本文分享自魔乐社区公众号《》还在忍受外网下载DeepSeek模型权重的龟速吗?DeepSeek模型火爆全球,但无数国内开发者却在下载模型时苦不堪言,吐槽下载就像“用2G网下高清电影”。某大厂工程师反馈,从外网下载DeepSeekR1模型,速度仅为2MB/s
chatglm2-6b在P40上做LORA微调 | 京东云技术团队
目前,大模型的技术应用已经遍地开花。最快的应用方式无非是利用自有垂直领域的数据进行模型微调。chatglm26b在国内开源的大模型上,效果比较突出。本文章分享的内容是用chatglm26b模型在集团EA的P40机器上进行垂直领域的LORA微调。
【积微成著】性能测试调优实战与探索(存储模型优化+调用链路分析)| 京东物流技术团队
一、前言性能测试之于软件系统,是保障其业务承载能力及稳定性的关键措施。以软件系统的能力建设为主线,系统能力设计工作与性能测试工作,既有先后之顺序,亦有相互之影响。以上,在性能测试的场景决策,架构分析、流量分析、压测实施和剖解调优等主要环节中,引发对于系统能
京东云开发者 京东云开发者
10个月前
chatglm2-6b在P40上做LORA微调
背景:目前,大模型的技术应用已经遍地开花。最快的应用方式无非是利用自有垂直领域的数据进行模型微调。chatglm26b在国内开源的大模型上,效果比较突出。本文章分享的内容是用chatglm26b模型在集团EA的P40机器上进行垂直领域的LORA微调。一、c