Java系统架构

Wesley13
• 阅读 543

如果你所在的公司/团队还 没有应用监控基础设施 ,如何让系统在上线后及时知道发生了问题? 其中一个非常简单的方案就是对日志进行实时扫描监控.

怎么做?

不管你用的是什么框架,你的日志库应该可以设置日志级别.将日志级别打印在日志行的最开始.
例如:

    [ERROR] xxx
    [WARN] xxx
    [INFO] xxx
    [DEBUG] xxx

这样,你在应用中添加一个固定频率的调度任务,这个任务会扫描新增的日志数据,通过判断行数据的开始几个字符来确定你是否要进行告警,例如发邮件,发短信.这样你接受到通知后去查看日志发生了什么.

小技巧: 设置一个标记位,记住你上次扫描到了文件的哪个位置,避免重复处理. 标记位如果是基于内存的,扫描前先判断下是否为0,如果为0就只记下当前的文件尾部位置,不扫描处理.因为通常情况下系统重启后的日志是追加到当前日志文件后面的.这样做就可以从系统启动后的日志位置开始扫描.

实施

ERROR级别日志每10秒扫描一次日志,统计次数后告警.
WARN级别日志每小时扫描一次日志,汇总统计次数后告警

进一步

告警的方式可以是邮件,短信,微信消息.所以这一块你可能需要做成一个服务接口,接受告警数据后触发某种告警通知.成熟的工具有Zabbix , Nagios 等或者简单点(可靠性考虑)再编写个服务接口(考虑到升级维护,功能性,扩展性,还是用开源的专业系统比较好)

你还需要查看日志发生了什么事情,如果系统甚少,你可以直接上服务器查看日志文件检查问题.如果是大规模服务集群,为了快速定位问题,你需要一个分布式的日志收集系统.开源流行的解决方案有 EFK 日志采集 .

思考本质

告警不能解决你的问题,而系统中又必然出现问题.所以在设计系统时,尽量能"恢复".
解决方案:

  • 连续的大量任务逻辑,拆分成多个的小任务
  • 操作幂等.做一次和做N次结果相同
  • 事件驱动.一次一小步
点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
待兔 待兔
5个月前
手写Java HashMap源码
HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程22
Stella981 Stella981
3年前
Golang日志框架之logrus
golang日志库golang标准库的日志框架非常简单,仅仅提供了print,panic和fatal三个函数对于更精细的日志级别、日志文件分割以及日志分发等方面并没有提供支持。所以催生了很多第三方的日志库,但是在golang的世界里,没有一个日志库像slf4j那样在Java中具有绝对统治地位。golang中,流行的日志框架包括logr
Stella981 Stella981
3年前
Spring Boot日志集成
!(https://oscimg.oschina.net/oscnet/1bde8e8d00e848be8b84e9d1d44c9e5c.jpg)SpringBoot日志框架SpringBoot支持JavaUtilLogging,Log4j2,Lockback作为日志框架,如果你使用star
Stella981 Stella981
3年前
RabbitMQ指南之四:路由(Routing)和直连交换机(Direct Exchange)
 在上一章中,我们构建了一个简单的日志系统,我们可以把消息广播给很多的消费者。在本章中我们将增加一个特性:我们可以订阅这些信息中的一些信息。例如,我们希望只将error级别的错误存储到硬盘中,同时可以将所有级别(error、info、warning等)的日志都打印在控制台上。1、绑定(Bindings) 
Wesley13 Wesley13
3年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Wesley13 Wesley13
3年前
ORACLE DATAGUARD 日志传输状态监控
ORACLEDATAGUARD的主备库同步,主要是依靠日志传输到备库,备库应用日志或归档来实现。当主、备库间日志传输出现GAP,备库将不再与主库同步。因此需对日志传输状态进行监控,确保主、备库间日志没有GAP,或发现GAP后及时处理。除了在告警日志中查看日志同步情况外,还可以通过查看相关视图来对日志传输状态进行监控。1、主、备库查看当前日志状况
Stella981 Stella981
3年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
京东云开发者 京东云开发者
11个月前
分布式日志追踪ID实战 | 京东物流技术团队
本文通过介绍分布式应用下各个场景的全局日志ID透传思路,以及介绍分布式日志追踪ID简单实现原理和实战效果,从而达到通过提高日志查询排查问题的效率。背景开发排查系统问题用得最多的手段就是查看系统日志,相信不少人都值过班当过小秘吧:给下接口和出入参吧,麻烦看看