阿里云怎么使用ecs监控中的进程监控?

云服务器ECS是阿里云所提供的性能卓越、稳定可靠、可弹性扩展的IaaS级别云计算服务。使用云服务器ECS可以不用采购IT硬件设备,直接像使用水、电、天然气等公共资源一样便捷、高效地使用服务器,实现计算资源的即开即用和弹性伸缩。众多业务或服务在ECS上面运行,机器的稳定性对维持服务的稳定性来说尤为关键。本期将为大家介绍利用阿里云SLS(原日志服务),采集ECS的CPU、内存、负载、磁盘、网络等监控数据,并进行智能巡检与异常检测,形成对ECS主机的健康监控大盘,帮助你更好的管理并维护自己的云服务器。

对于云服务器的稳定性,有如下黄金指标值得我们关注:

有关云服务器的更多指标(总计46个),可以关注SLS官方文档:

进入,选择接入数据中的主机监控,可以进入如下界面:

以呼和浩特集群为例,在选择了目标ProjectMetricStore之后,您可以选择要监控的ECS机器,组合成机器组:

这里选择的机器组要安装配置Logtail:

Logtail安装成功,心跳正常后,就可以开始采集主机的监控数据啦。您只需要配置如下规则即可采集到对ECS的各项监控指标数据。有关配置参考官方文档

点击左下角的开启指标巡检,SLS的机器学习服务将为您实时自动分析监控指标时序数据。智能巡检服务通过机器学习,神经网络等AI算法,以流式的方式不断学习历史数据,对当前的指标状态进行异常分析。有关算法详情请见。

至此,我们已经完成了ECS主机监控以及时序指标巡检的全部配置。完成配置后,您的目标project下将被创建如下工程:

其中,主机监控主机监控-ML 分别是指标数据可视化与异常检测结果可视化两个大盘,您可以在上面看到您所监控的ECS指标整体情况与健康度情况。

上面两图展示了异常巡检结果的大盘。从图中,我们可以对所监控的机器进行智能化的分析。SLS机器学习服务会为您自动学习历史数据,判断当前指标的异常与否,将结果汇总于大盘。您可以通过通过大盘看到整体汇总的异常信息,以及单指标上的异常位置(三角形符号标识)。点击异常点进入,可以看到该机器整体指标的变化情况。

在主机监控大盘中,您可以看到该机器更加详细的指标变化情况。您可以通过观察指标的变化来判断当前ECS的健康状态,设置相应的告警,辅助您的运维或运营工作。

阿里云SLS(原日志服务)针对日志与指标监控提供了完整的解决方案,以下相关功能是日志进阶的必备良药:

更多日志进阶内容可以参考:。


纠错或者帮助文档以及最佳实践贡献,请联系:笃林

谁让我们使用的是云产品呢,哎~

图。但是,由于“年久失修”,在使用的时候遇到不少问题,再加上个人代码能力青铜三段,重写有点难,那就硬修吧。以下是在使用时遇到的问题。

现场拜访,线下实地,1天免费拜访

关注“爱可生开源社区”公众号,回复关键字“Mycat”,获取活动详情。

格式:[投稿]姓名+文章标题

以附件形式发送,正文需注明姓名、手机号、微信号,以便小编及时联系

使用监控自定义监控实现GPU服务器的GPU监控

本文将介绍如何利用阿里云云监控服务提供的自定义监控实现GPU云服务器的GPU监控和报警的可视化,从而达到对GPU使用情况实时掌握的目的。1 背景 NVIDIA提供了nvidia-smi命令工具用于查询和监控GPU的相关数据,但是...

如何实现Docker应用的自定义弹性伸缩

阿里云容器服务提供了服务弹性伸缩触发器,并能够跟监控框架集成来实现自定义的服务自动弹性伸缩。阿里云容器服务会自动采集容器的监控数据,并可以通过集成将监控数据发送到三方的监控框架中。有了监控数据,我们...

使用云监控实现GPU服务器的GPU监控和报警(上)-...

2 自定义监控和报警阿里云云监控服务提供了自定义监控功能,用户可以利用它实现自定义的数据监控和报警。我们利用自定义监控提供的API或者SDK,可以将GPU云主机内采集的GPU数据上报,在云监控控制台上添加相应的/zhibo 立即加入社群,与专家面对面,及时了解课程最新动态!【云栖号在线课堂 社群】...

弹性计算双周刊 第 10 期

如何使用阿里云云监控服务提供的自定义监控功能,利用自定义监控提供的API或者SDK,通过自定义脚本可以将GPU云主机内采集的GPU数据上报,在云监控控制台上添加相应的GPU监控项,就可以实现对指定GPU实例内指定GPU的...

我要回帖

更多关于 ecs云服务器怎么搭建网站 的文章

 

随机推荐