火山引擎MARS-APMPlus 应用性能监控帮助客户Java OOM崩溃率下降80%
本文将会从Java内存基础开始,详细介绍“基于Hprof内存快照的线上JavaOOM归因方案”的底层原理与技术细节,欢迎接入MARSAPMPlus应用性能监控使用。作者:字节跳动终端技术——王涛一、前言如何定位和解决AndroidApp因为内存不足(JavaOOM)引发的线上问题一直是业界的难题。崩溃场景能抓取到的常规信息中并不包括内存分配详情——不了解内存被谁持有,自然也无法追查内存不足的根源。针对这个问题,ClientInfra和头条抖音等业务方合作,通过一系列技术调研,自研了一套基
Wesley13 Wesley13
3年前
20款开发运维必备的顶级工具
!(https://oscimg.oschina.net/oscnet/3d0acef56f214fcdb6401f40fa99c539.gif)开发运维工具与软件开发领域的最佳实践密切相关,也与必要的规范密切相关。在整个开发生命周期涉及到一大批新旧工具,从规划、编码、测试、发布到监控。本文介绍你应该考虑添加到工具箱中的20种开发运维工具,供
Stella981 Stella981
3年前
Comet:基于 HTTP 长连接的“服务器推”技术
很多应用譬如监控、即时通信、即时报价系统都需要将后台发生的变化实时传送到客户端而无须客户端不停地刷新、发送请求。本文首先介绍、比较了常用的“服务器推”方案,着重介绍了Comet-使用HTTP长连接、无须浏览器安装插件的两种“服务器推”方案:基于AJAX的长轮询方式;基于iframe及htmlfile的流方式。最后分析了开发Comet
Stella981 Stella981
3年前
JVM 常用命令行工具
本文部分摘自《深入理解Java虚拟机第三版》基础故障处理工具Java开发人员肯定都知道JDK的bin目录下有许多小工具,这些小工具除了用于编译和运行Java程序外,打包、部署、签名、调试、监控、运维等各种场景都可能会见到它们的影子本文主要介绍的是用于监视虚拟机运行状态和进行故障处理的工具,根
Wesley13 Wesley13
3年前
InnoDB数据页什么时候合并
1\.为什么要合并数据页2\.什么时候合并数据页2.1准备测试环境2.2找到两个相邻页2.3试探性逐步删除数据,接近阈值2.4再次只删除一条记录,验证是否合并3\.其他补充说明3.1除了表级可以设置外,单个索引也可以设置合并阈值3.2页合并状态监控3.3如何适当调整阈值设置延伸阅读当低于设定的阈值时就进行合并在本文开始
Stella981 Stella981
3年前
Electron 在 Taro IDE 的开发实践
背景—TaroIDE是一款我们正在精心打造的一站式移动端研发工作台。除了需要实现Taro从创建项目到预览、编译的全部能力,还需要打通用户测试、调试、监控等一系列流程。为了提升开发体验,仅仅一个命令行工具是远远不够的,我们需要开发一款桌面客户端,并同时提供Windows、MacOS等不同系统的版本。Electron\1\ 最初是
Stella981 Stella981
3年前
Kubernetes Pod OOM 排查日记
一、发现问题在一次系统上线后,我们发现某几个节点在长时间运行后会出现内存持续飙升的问题,导致的结果就是Kubernetes集群的这个节点会把所在的Pod进行驱逐OOM;如果调度到同样问题的节点上,也会出现Pod一直起不来的问题。我们尝试了杀死Pod后手动调度的办法(label),当然也可以排除调度节点。但是在一段时间后还会复现,我们通过监控
Easter79 Easter79
3年前
TimescaleDB比拼InfluxDB:如何选择合适的时序数据库?
https://www.itcodemonkey.com/article/9339.html时序数据已用于越来越多的应用中,包括物联网、DevOps、金融、零售、物流、石油天然气、制造业、汽车、太空、SaaS,乃至机器学习和人工智能。虽然当前时序数据库仅局限于采集度量和监控,但是软件开发人员已经逐渐明白,他们的确需要一款时序数据库,真正设计用于运行多种工
Stella981 Stella981
3年前
720 智能硬件与 LeanCloud 云端的默契协作
【玩转LeanCloud】开发者经验分享:作者:谢子超720技术负责人,从业十余年,一直负责软件开发工作。我们的产品是与监控和改善室内空气质量相关的智能硬件,我们使用LeanCloud平台已经有2年多了,借此机会与其他从事智能硬件生产及应用解决方案的团队分享下我们的经验。我们的主要硬件产品分为两部分:环境监测设备(环境宝)和环境
京东云开发者 京东云开发者
5个月前
供应链大屏设计实践
概述在物流系统相关的大屏中,供应链大屏复杂度较高,数据链路较长,稳定性要求较高,当前大屏已经经过2年时间的打磨,整体表现已经相对比较成熟稳定。本文描述了物流供应链业务较复杂的业务场景下,结合了大数据计算相关技术,总结了实时监控大屏指标建设和服务构建的框架和