火山引擎MARS-APMPlus 应用性能监控帮助客户Java OOM崩溃率下降80%
本文将会从Java内存基础开始,详细介绍“基于Hprof内存快照的线上JavaOOM归因方案”的底层原理与技术细节,欢迎接入MARSAPMPlus应用性能监控使用。作者:字节跳动终端技术——王涛一、前言如何定位和解决AndroidApp因为内存不足(JavaOOM)引发的线上问题一直是业界的难题。崩溃场景能抓取到的常规信息中并不包括内存分配详情——不了解内存被谁持有,自然也无法追查内存不足的根源。针对这个问题,ClientInfra和头条抖音等业务方合作,通过一系列技术调研,自研了一套基
Stella981 Stella981
4年前
CentOS 6部署监控神器普罗米修斯(详细部署说明)
部署说明:环境说明:组件版本下载地址Prometheus2.6.1https://prometheus.io/download/prometheus(https://www.oschina.net/action/GoToLink?urlhttps%3A%2F%2Fprometheus.io%2Fdo
Wesley13 Wesley13
4年前
20款开发运维必备的顶级工具
!(https://oscimg.oschina.net/oscnet/3d0acef56f214fcdb6401f40fa99c539.gif)开发运维工具与软件开发领域的最佳实践密切相关,也与必要的规范密切相关。在整个开发生命周期涉及到一大批新旧工具,从规划、编码、测试、发布到监控。本文介绍你应该考虑添加到工具箱中的20种开发运维工具,供
Stella981 Stella981
4年前
JVM 常用命令行工具
本文部分摘自《深入理解Java虚拟机第三版》基础故障处理工具Java开发人员肯定都知道JDK的bin目录下有许多小工具,这些小工具除了用于编译和运行Java程序外,打包、部署、签名、调试、监控、运维等各种场景都可能会见到它们的影子本文主要介绍的是用于监视虚拟机运行状态和进行故障处理的工具,根
Wesley13 Wesley13
4年前
InnoDB数据页什么时候合并
1\.为什么要合并数据页2\.什么时候合并数据页2.1准备测试环境2.2找到两个相邻页2.3试探性逐步删除数据,接近阈值2.4再次只删除一条记录,验证是否合并3\.其他补充说明3.1除了表级可以设置外,单个索引也可以设置合并阈值3.2页合并状态监控3.3如何适当调整阈值设置延伸阅读当低于设定的阈值时就进行合并在本文开始
Stella981 Stella981
4年前
Knative 应用在阿里云容器服务上的最佳实践
作者|元毅阿里云智能事业群高级开发工程师相信通过前面几个章节的内容,大家对Knative有了初步的体感,那么在云原生时代如何在云上玩转Knative?本篇内容就给你带来了 Knative应用在阿里云容器服务上的最佳实践。何为最佳实践,就是按照生产可用的方式部署服务,提供服务监控告警以及链路追踪。我们按照如下3个部分内容进行:
Wesley13 Wesley13
4年前
RPC设计概要
前言RPC全程远程方法调用,已经在各大小公司被广泛使用,种类也是很多比如:Dubbo,Springcloud那一套,GRPC,Thrift,可能还有很多公司自研的等等;每个公司都可能根据自己的业务需求,场景选择自己合适的RPC框架;但大体的考察维度无非就这么几个:性能,可扩展性,跨平台,功能性,可监控,使用性;所以我们如果要设计一个RPC框架,可
Easter79 Easter79
4年前
TimescaleDB比拼InfluxDB:如何选择合适的时序数据库?
https://www.itcodemonkey.com/article/9339.html时序数据已用于越来越多的应用中,包括物联网、DevOps、金融、零售、物流、石油天然气、制造业、汽车、太空、SaaS,乃至机器学习和人工智能。虽然当前时序数据库仅局限于采集度量和监控,但是软件开发人员已经逐渐明白,他们的确需要一款时序数据库,真正设计用于运行多种工
Stella981 Stella981
4年前
LiteOS间歇计算技术:IOT终端真正感受“电量自由”
摘要:LiteOS间歇计算为什么能使物联网终端实现长续航?物联网设备、场景复杂多样,小到智能穿戴的耳机,大到大型基建设备,更有我们陌生而又熟悉场景,例如深海探测、森林监控、野生动物跟踪等等能量采集场景。能量采集场景都在户外,甚至可以说是无人区域,当设备放置(部署)后,没办法及时回收和维护,比如放置在动物身上的设备,位置是不固定的,无法及时为终端设
Stella981 Stella981
4年前
720 智能硬件与 LeanCloud 云端的默契协作
【玩转LeanCloud】开发者经验分享:作者:谢子超720技术负责人,从业十余年,一直负责软件开发工作。我们的产品是与监控和改善室内空气质量相关的智能硬件,我们使用LeanCloud平台已经有2年多了,借此机会与其他从事智能硬件生产及应用解决方案的团队分享下我们的经验。我们的主要硬件产品分为两部分:环境监测设备(环境宝)和环境