DevOpSec DevOpSec
4年前
CPU负载过高异常排查实践与总结
昨天下午突然收到运维邮件报警,显示数据平台服务器cpu利用率达到了98.94%,而且最近一段时间一直持续在70%以上,看起来像是硬件资源到瓶颈需要扩容了,但仔细思考就会发现咱们的业务系统并不是一个高并发或者CPU密集型的应用,这个利用率有点太夸张,硬件瓶颈应该不会这么快就到了,一定是哪里的业务代码逻辑有问题。1、排查思路1.1 定位高负载进程首先
Wesley13 Wesley13
3年前
Ubuntu下Nginx启动、停止等常用命令
本文详细介绍Ubuntu(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Fwww.linuxidc.com%2Ftopicnews.aspx%3Ftid%3D2)下Nginx启动、停止等常用命令。在开发过程中,我们会经常的修改Nginx的配置文件,每次修改配置文件都可以先测试下本次修改的配
Stella981 Stella981
3年前
Linux查看系统负载(CPU和MEM考虑)
查看占用CPU最高的10个进程tidb@:vg_adn_tidbCkhsTest:172.31.30.62~/tidbansible$psaux|grepvPID|sortrnk3|headmysql300496.660.42089525218873436?Sl
Stella981 Stella981
3年前
Nginx学习笔记——安装
Nginx安装linux安装下载tar.gz包,以及依赖openssl、zlib、pcreopenssl、zlib、pcre安装cd对应目录 ./configuremakemakeinstallnginx安装cd对应目录./configure
Wesley13 Wesley13
3年前
GPE监控预警系统
MonitornginxforPrometheusnginxvtsandlua的安装前置条件源码安装nginx安装下载wgethttps://github.com/simpl/ngx_devel_kit/arch
Stella981 Stella981
3年前
Kubernetes YAML最佳实践和策略
Kubernetes工作负载最常用YAML格式的文件来定义。YAML的问题之一就是很难描述清单文件之间的约束或关系。如果你希望检查是否已从受信任的注册表中提取部署到群集中的所有映像,该怎么办?如何防止没有Pod安全策略的工作负载提交到集群?集成静态检查可以在更接近开发生命周期的时间内捕获错误和违反策略的行为。并且由于改善了资源定义
Stella981 Stella981
3年前
Locust 安装
Locust介绍  Locust是一个易于使用、分布式的负载测试工具,它可以对网站或其他系统进行负载测试,并计算出一个系统能够承受多少的并发用户。Locust完全基于事件,因此可以在一台机器上支持数千名并发用户,与其他基于事件的应用相比,它不使用回调。与jmeter、loadrunner相比,Locust不需要笨重的UI或臃肿的xml
Stella981 Stella981
3年前
Nginx 的 location 匹配规则
约定本文以Nginx1.17.6主线版为准。引言location是Nginx配置中的重要一环,用来配置动静分离、反向代理等功能。而location匹配规则,网上有太多错误的说法,今予以纠正并给出正确规则描述。最常见的错误最常见的错误之一,就是认为^~的优先级高于~,但实际上,我们
Crane-scheduler:基于真实负载进行调度
作者邱天,腾讯云高级工程师,负责腾讯云TKE动态调度器与重调度器产品。背景原生kubernetes调度器只能基于资源的resourcerequest进行调度,然而Pod的真实资源使用率,往往与其所申请资源的request/limit差异很大,这直接导致了集群负载不均的问题:1.集群中的部分节点,资源的真实使用率远低于resourc
基于MCP协议的企业级AI服务网关架构设计与动态插件化实现
API网关1、使用统一一套网关,直接接管3大功能,作为流量网关、安全网关、业务网关(API网关),避免链路过长,降低复杂性,提高性能。2、除了能接管k8s里面的负载外,也能接管k8s外面的负载。3、插件能自由添加缩减,并不需要跟网关版本同时发版。3、天然集