火山引擎MARS-APMPlus 应用性能监控帮助客户Java OOM崩溃率下降80%
本文将会从Java内存基础开始,详细介绍“基于Hprof内存快照的线上JavaOOM归因方案”的底层原理与技术细节,欢迎接入MARSAPMPlus应用性能监控使用。作者:字节跳动终端技术——王涛一、前言如何定位和解决AndroidApp因为内存不足(JavaOOM)引发的线上问题一直是业界的难题。崩溃场景能抓取到的常规信息中并不包括内存分配详情——不了解内存被谁持有,自然也无法追查内存不足的根源。针对这个问题,ClientInfra和头条抖音等业务方合作,通过一系列技术调研,自研了一套基
Stella981 Stella981
3年前
CentOS 6部署监控神器普罗米修斯(详细部署说明)
部署说明:环境说明:组件版本下载地址Prometheus2.6.1https://prometheus.io/download/prometheus(https://www.oschina.net/action/GoToLink?urlhttps%3A%2F%2Fprometheus.io%2Fdo
Wesley13 Wesley13
3年前
20款开发运维必备的顶级工具
!(https://oscimg.oschina.net/oscnet/3d0acef56f214fcdb6401f40fa99c539.gif)开发运维工具与软件开发领域的最佳实践密切相关,也与必要的规范密切相关。在整个开发生命周期涉及到一大批新旧工具,从规划、编码、测试、发布到监控。本文介绍你应该考虑添加到工具箱中的20种开发运维工具,供
Stella981 Stella981
3年前
Comet:基于 HTTP 长连接的“服务器推”技术
很多应用譬如监控、即时通信、即时报价系统都需要将后台发生的变化实时传送到客户端而无须客户端不停地刷新、发送请求。本文首先介绍、比较了常用的“服务器推”方案,着重介绍了Comet-使用HTTP长连接、无须浏览器安装插件的两种“服务器推”方案:基于AJAX的长轮询方式;基于iframe及htmlfile的流方式。最后分析了开发Comet
Stella981 Stella981
3年前
JVM 常用命令行工具
本文部分摘自《深入理解Java虚拟机第三版》基础故障处理工具Java开发人员肯定都知道JDK的bin目录下有许多小工具,这些小工具除了用于编译和运行Java程序外,打包、部署、签名、调试、监控、运维等各种场景都可能会见到它们的影子本文主要介绍的是用于监视虚拟机运行状态和进行故障处理的工具,根
Stella981 Stella981
3年前
Kubernetes Pod OOM 排查日记
一、发现问题在一次系统上线后,我们发现某几个节点在长时间运行后会出现内存持续飙升的问题,导致的结果就是Kubernetes集群的这个节点会把所在的Pod进行驱逐OOM;如果调度到同样问题的节点上,也会出现Pod一直起不来的问题。我们尝试了杀死Pod后手动调度的办法(label),当然也可以排除调度节点。但是在一段时间后还会复现,我们通过监控
Stella981 Stella981
3年前
720 智能硬件与 LeanCloud 云端的默契协作
【玩转LeanCloud】开发者经验分享:作者:谢子超720技术负责人,从业十余年,一直负责软件开发工作。我们的产品是与监控和改善室内空气质量相关的智能硬件,我们使用LeanCloud平台已经有2年多了,借此机会与其他从事智能硬件生产及应用解决方案的团队分享下我们的经验。我们的主要硬件产品分为两部分:环境监测设备(环境宝)和环境
SpringMvc集成开源流量监控、限流、熔断降级、负载保护组件Sentinel | 京东云技术团队
前言:作者查阅了Sentinel官网、51CTO、CSDN、码农家园、博客园等很多技术文章都没有很准确的springmvc集成Sentinel的示例,因此整理了本文,主要介绍SpringMvc集成SentinelSpringMvc集成Sentinel一、S
京东云开发者 京东云开发者
5个月前
供应链大屏设计实践
概述在物流系统相关的大屏中,供应链大屏复杂度较高,数据链路较长,稳定性要求较高,当前大屏已经经过2年时间的打磨,整体表现已经相对比较成熟稳定。本文描述了物流供应链业务较复杂的业务场景下,结合了大数据计算相关技术,总结了实时监控大屏指标建设和服务构建的框架和
sum墨 sum墨
2个月前
《优化接口设计的思路》系列:第三篇—留下用户调用接口的痕迹
接口设计是整个系统设计中非常重要的一环,其中包括限流、权限、入参出参、切面等方面。设计一个好的接口可以帮助我们省去很多不必要的麻烦,从而提升整个系统的稳定性和可扩展性。作为接口设计经验分享的第三篇,我想分享一下如何在用户使用过程中留下操作痕迹。在实际开发中,我会采取一些手段来记录用户操作,例如使用日志记录用户行为,或者在数据库中保存用户操作记录。这些痕迹可以帮助我们快速定位和解决问题,同时也可以为后续数据分析和优化提供有价值的参考。