Cloud Insight 客户案例

Stella981
• 阅读 579

在不断迭代的过程中,Cloud Insight 也很重视客户对产品的使用体验,这次我们拜访了晨芯时代,了解到他们在使用 Cloud Insight 过程中对产品的一些想法。

客户背景

晨芯时代是一家开发电视盒子等产品的公司,由外包公司为其产品进行服务器端开发,他们自身不在服务器开发和系统运维方面进行特别大的投入,因此选择使用我们的产品 Cloud Insight——即 Ci,进行服务器端的监控。

晨芯时代一共搭建了9台服务器(CentOS),部署有 MySQL、Memcached、Nginx、Redis,使用 CI 监控系统和除 Redis 外的其他三项服务。他们主要关注系统网络与进程的性能指标。在使用 CI 之前一直使用 OneAPM Servers 监控系统性能指标。

Cloud Insight 采用 StatsD 的采集技术,对接 MySQL、Redis、MongoDB,以及 CentOS、RedHat 操作系统,利用 Hbase 存储和 OpenTSDB 的数据聚合、切片等功能,最终流向 Cloud Insight 进行展现。从而帮助优络时代实现低成本、高效的自动化运维。

Cloud Insight 客户案例

面临问题

由于客户是初创团队,在人员和资源方面都比较不足,且暂时并不打算在服务器端开发和运维方面投入太大的人力成本,因此需要一款优秀的性能监控工具帮助其提高在运维方面的效率同时降低运维成本。

客户之前使用 OneAPM Server 监控主机服务器,帮助其在遇到网路性能瓶颈与内存占用率过高时更快的定位系统问题,提高解决问题的效率。现在使用 OneAPM Cloud Insight 来更好的实现这一点。

解决方案

首先 Cloud Insight 通过拓扑图让用户能够直观的看到集群结构,快速定位性能不佳的机器。上帝视角管理主机,逻辑清晰而且方便。

Cloud Insight 客户案例

通过平台列表可以大致了解各个 host 的基本性能情况,包括实时状态,CPU 占用率、I/O Wait、搭载的平台服务等信息。

由于客户主要关注 System Networking 这一块的性能,那么着重来看一下这一块,总览页可以看到某个主机的实时运行情况,包括 disk io, network、CPU 等数据。而通过仪表盘我们可以看到多台服务器的统计数据,Cloud Insight 通过对数据进行聚合与分组,让数据对客户来说更有意义。关于数据聚合与分组功能,可以参考文章 数据聚合 & 分组:新一代系统监控的核心功能

通过 Cloud Insight 监控 System Networking 截图如下:

Cloud Insight 客户案例

而通过 Memcached、Nginx、Mysql 三个平台各自的性能图表,我们可以锁定对系统性能产生影响的模块,从而更好地明确优化性能的方向。

Cloud Insight 客户案例

客户反馈

不足之处

  1. 仪表盘展现形式不够丰富,全部指标都是用折线图来展示,不如之前 OneAPM Server 的展现形式直接易懂。
  2. 指标单位使用不符合用户习惯,例如客户提到在网络传输上他们一般习惯使用 bits 而我们提供的是 bytes,导致使用时混乱。
  3. 安装平台服务时不够简化,希望安装能够实现命令行化。
  4. 指标参数太复杂导致其不会使用自定义仪表盘。
  5. 整体使用感受不如之前 OneAPM Server 简单易用,很多性能指标需要进行再次转化才能得到客户需要的结果,客户认为不够傻瓜化并没有减少运维人员的工作量。

而针对用户提出的这些,我们的想法是

  1. 我们会针对「System 总览」这个仪表盘,进行优化。添加排行榜、位移图、状态图、曲线图等多种展现形式,来提高可读性。而这些可视化的形式,未来会增加自定义的功能,满足不同用户的使用习惯。
  2. 我们会在六月份前后提供单位的自定义功能。除此之外,也将在自定义仪表盘中,提供指标的代数运算。从而可以通过加减乘除,来自行消除这样的问题。
  3. Cloud Insight 其实已经是一行命令就可以安装了,大部分用户都称赞我们的安装非常简单。
  4. 指标方面我们会提供自定义解释字段的功能,增加指标参数的解析引导帮助,将指标的单位修改为用户习惯使用的单位,改进用户体验,提升产品的易用性。也希望有需求的用户多阅读官方文件和我们的文档进行学习。
  5. Cloud Insight 之所以没有自动发现平台服务,是为了让用户通过配置,更加了解自己的技术栈从而实现更好的管理。

客户对 Cloud Insight 价值的认可

  1. Cloud Insight 能够更傻瓜化进行性能监控,监控数据全面,界面优美,极大地方便了对运维有需求却缺乏人力和资金的创业公司,是刚需产品。
  2. 能够监测平台服务的性能指标是产品的亮点。

Cloud Insight 集监控、管理、计算、协作、可视化于一身,帮助所有 IT 公司,减少在系统监控上的人力和时间成本投入,让运维工作更加高效、简单。

本文转自 OneAPM 官方博客

点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
待兔 待兔
4个月前
手写Java HashMap源码
HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程22
Jacquelyn38 Jacquelyn38
3年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
【敏捷研发系列】前端DevOps流水线实践
软件开发从传统的瀑布流方式到敏捷开发,将软件交付过程中开发和测试形成快速的迭代交付,但在软件交付客户之前或者使用过程中,还包括集成、部署、运维等环节需要进一步优化交付效率。因此Devops的产生将敏捷的相关理念扩展到运维侧,从而将产品、设计、开发、测试、运维团队更紧密的结合在一起。而从交付给客户产品视角看,前端研发通常又是在整个产品设计开发链条的最终节点,意味着前端团队受到上游变更的影响是最大的,并且从经营理念效率出发,提升前端交付效率是至关重要的。
Wesley13 Wesley13
3年前
PHP 代码加密面面观
时代在发展,在PHP平台上开发的开发者越来越多。“天下熙熙,皆为利来;天下攘攘,皆为利往”,许多开发者使用PHP开发他们的商业产品,并将其进行二次分发。可惜由于PHP的机制受限,开发者们只能分发源代码,这对他们的版权保护极为不利,导致PHP界涌现出了不少加密产品。笔者最近想了想,在这里对这些加密产品进行逐项介绍,以飨各位读者。如果你没有任何技术背景,笔者
Stella981 Stella981
3年前
Android So动态加载 优雅实现与原理分析
背景:漫品Android客户端集成适配转换功能(基于目标识别(So库35M)和人脸识别库(5M)),导致apk体积50M左右,为优化客户端体验,决定实现So文件动态加载.!(https://oscimg.oschina.net/oscnet/00d1ff90e4b34869664fef59e3ec3fdd20b.png)点击上方“蓝字”关注我
Easter79 Easter79
3年前
Twitter的分布式自增ID算法snowflake (Java版)
概述分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的。有些时候我们希望能使用一种简单一些的ID,并且希望ID能够按照时间有序生成。而twitter的snowflake解决了这种需求,最初Twitter把存储系统从MySQL迁移
体验问题哪里找?点击链接获取答案~ | 京东云技术团队
用户体验(UserExperience,简称UX)是指用户在与产品、系统或服务进行交互的过程中所产生的主观感受和情感反应。它涵盖了用户对产品或服务的使用过程中所体验到的方方面面,包括界面设计、交互流程、功能性、易用性、可靠性、响应速度、视觉美感等。
京东云开发者 京东云开发者
10个月前
大数据平台Bug Bash大扫除最佳实践
一、背景随着越来越多的"新人"在日常工作以及大促备战中担当大任,我们发现仅了解自身系统业务已不能满足日常系统开发运维需求。为此,大数据平台部门组织了一次BugBash活动,既能提升自己对兄弟产品的理解和使用,又能促使自家产品功能日趋完善。今天来给大家分享一