哪种监控工具才是铁塔运维监控系统网址人的最爱

【IT运维监控】讨论哪种运维监控工具才是IT运维人员的最爱?_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
【IT运维监控】讨论哪种运维监控工具才是IT运维人员的最爱?
上传于||文档简介
&&讨​论​哪​种​运​维​监​控​工​具​才​是​I​T​运​维​人​员​的​最​爱​?
阅读已结束,如果下载本文需要使用0下载券
想免费下载更多文档?
定制HR最喜欢的简历
你可能喜欢您所在的位置: &
开源还是商用?十大云运维监控工具测评告诉你答案(2)
开源还是商用?十大云运维监控工具测评告诉你答案(2)
随着云计算和互联网的高速发展,大量应用需要横跨不同网络终端,并广泛接入第三方服务(如支付、登录、导航等),IT系统架构越来越复杂。本文对业内主流的开源运维监控系统和商业运维监控系统进行对比,分析各种产品的定位、目标用户和功能特点,希望帮助广大运维、开发和创业者找到最适合自己的运维工具。
(三)Ganglia
推荐星级:★★★★☆
Ganglia是加州大学伯克利分校发起的一个开源集群监控项目,设计之初是用于监控数以千计的网络节点。Ganglia是一个跨平台可扩展的,高性能计算系统下的分布式监控系统。它已被广泛移植到各种操作系统和处理器架构上。
用户群:适用于大型服务器集群用户。
1.适合监控系统性能,通过曲线很容易见到每个节点的工作状态。
2.可以自定义监控项,监控展示有表格和图像两种,支持手机版。
3.部署方便,通过不同的分层管理上万台机器,无需逐个添加配置。
1.没有内置的消息通知系统。
2.没有报警机制,出现问题不能够及时报警。
(四)Zenoss
推荐星级:★★★★☆
Zenoss Core是Zenoss的开源版本,其商用版本为Zenoss Enterprise。作为企业级智能监控软件,Zenoss
Core允许IT管理员依靠单一的Web控制台来监控网络架构的状态和健康度。Zenoss
Core的强大能力来自于深入的列表与配置管理数据库,以发现和管理公司IT环境的各类资产。Zenoss同时提供与CMDB关联的事件和错误管理系统,以协助提高各类事件和提醒的管理效率。
1.Zenoss比较出色的地方在于它的Dashboard,可以配置很多portlet。
2.每个用户的界面都是分开管理的,自定义dashboard不会影响其他用户。
3.强大监控功能支持服务器、路由交换、防火墙、存储、数据库、中间件监控。
4.采用基于HBASE的opentsdb存储任意时间段的数据。
5.将状态监控,性能监控,资源管理,良好的报告机制进行有机的整合。
1.对资源要求较高,即使只管理少数几台设备,也需要消耗大量硬件及内存等附加资源。
2.针Windows系统,开源版只提供SNMP,通过WMI检测CPU,Disk,软硬件和性能只在收费版提供。
(五)Open-falcon
推荐星级:★★★☆☆
Open-falcon是小米运维团队从互联网公司的需求出发,根据多年的运维经验,结合SRE、SA、DEVS的使用经验和反馈,开发的一套面向互联网的企业级开源监控产品。
Open-falcon架构
用户群:目前有几十家企业用户不同程度使用。
1.自动发现,支持falcon-agent、snmp、支持用户主动push、用户自定义插件支持。
2.支持每个周期上亿次的数据采集、告警判定、历史数据存储和查询。
3.高效的portal、支持策略模板、模板继承和覆盖、多种告警方式、支持callback调用。
4.单机支撑200万metric的上报、归档、存储。
5.采用rrdtool的数据归档策略,秒级返回上百个metric一年的历史数据。
6.多维度的数据展示,用户自定义Screen。
7.通过各种插件目前支持Linux、Windows、Mysql、Redis、Memache、RabbitMQ和交换机监控。
缺点:由于发布时间较短,很多基础的服务监控插件(如Tomcat、apache等)还不支持,很多功能还在不断完善中,另外由于缺少专门的支持,虽然有开放社区,但是解决问题的效率相对较低。
内容导航&第 1 页: &第 2 页: &第 3 页:
关于&&&&的更多文章
开源的世界是一个分享的世界,在这个世界里,有辛勤奉献的技术开
Linux界极具活力,面向不同的用户可以使用不同的Linux发行版,比如适合新手和游戏爱好者等。
讲师: 17人学习过讲师: 7人学习过讲师: 16人学习过
Zabbix能监视各种网络参数,保证服务器系统的安全运营
性能监测是系统优化过程中重要的一环,如果没有监测、
OS X Server的Mavericks版本并没有发生这样巨大的变化
本书详细介绍了在最新Tomcat 5版本上开发Java Web应用的各种技术。主要内容包括:Tomcat和Java Web开发的基础知识,Java Web开发
51CTO旗下网站新手园地& & & 硬件问题Linux系统管理Linux网络问题Linux环境编程Linux桌面系统国产LinuxBSD& & & BSD文档中心AIX& & & 新手入门& & & AIX文档中心& & & 资源下载& & & Power高级应用& & & IBM存储AS400Solaris& & & Solaris文档中心HP-UX& & & HP文档中心SCO UNIX& & & SCO文档中心互操作专区IRIXTru64 UNIXMac OS X门户网站运维集群和高可用服务器应用监控和防护虚拟化技术架构设计行业应用和管理服务器及硬件技术& & & 服务器资源下载云计算& & & 云计算文档中心& & & 云计算业界& & & 云计算资源下载存储备份& & & 存储文档中心& & & 存储业界& & & 存储资源下载& & & Symantec技术交流区安全技术网络技术& & & 网络技术文档中心C/C++& & & GUI编程& & & Functional编程内核源码& & & 内核问题移动开发& & & 移动开发技术资料ShellPerlJava& & & Java文档中心PHP& & & php文档中心Python& & & Python文档中心RubyCPU与编译器嵌入式开发驱动开发Web开发VoIP开发技术MySQL& & & MySQL文档中心SybaseOraclePostgreSQLDB2Informix数据仓库与数据挖掘NoSQL技术IT业界新闻与评论IT职业生涯& & & 猎头招聘IT图书与评论& & & CU技术图书大系& & & Linux书友会二手交易下载共享Linux文档专区IT培训与认证& & & 培训交流& & & 认证培训清茶斋投资理财运动地带快乐数码摄影& & & 摄影器材& & & 摄影比赛专区IT爱车族旅游天下站务交流版主会议室博客SNS站务交流区CU活动专区& & & Power活动专区& & & 拍卖交流区频道交流区
UID空间积分0 积分1320阅读权限30帖子精华可用积分1320 信誉积分937 专家积分0 在线时间473 小时注册时间最后登录
家境小康, 积分 1320, 距离下一级还需 680 积分
帖子主题精华可用积分1320 信誉积分937 专家积分0 在线时间473 小时注册时间最后登录
认证徽章论坛徽章:5
获奖名单已公布:
在云计算领域,运维人员就是这样的存在,小到一条短信,大到一次网上交易,只要和IT相关的业务就需要这些运维人员,没有他们在背后的支持,生活是会出大乱子的。
可是到了云计算时代,不少人说IT人要下岗了,是否真会如此呢?云计算的出现是否会使得整体行业对运维的需求萎缩了呢?面对传统的几十台服务器时,运维人员还能手动处理一些问题,但是当机器发展到1000台、甚至是10000多台时,自动化运维必须得派上用场了。企业根据业务来分配和释放资源,运维人员不仅需要一个强大的控制系统来控制对网络流量、CPU利用率、进程、内存等等节点,还需要一个资源管理系统来管理这些资源的生命状态,还有权限管理,就像AWS的IAM一样。
话题讨论:1.云计算时代,运维人员是否会面临着失业的风险?2.传统的数据中心里,设备是真实存在的,管理起来相对简单,而虚拟化技术将这些资源都“池化了”,一旦故障发生,需要检查排除,云时代下您觉得在运维管理方面存在哪些痛点困扰呢?3.对云计算而言,一大堆机器和设备放在一起,安全成为了一大挑战。有哪些监控工具可以实现对资源的管理,对网络流量、CPU利用率、进程、内存等状态监控呢?4.在使用云服务,比如阿里云、腾讯云等,磁盘用到一定时候就会不稳定,很莫名其妙,磁盘I/O会变慢,到底是什么原因?您是否遇到过类似的经历?当时是如何解决的?5.考虑到安全性问题,大多数企业都会选择混合云,选择IBM的云,稳定但贵,您比较看好哪些云服务提供商?为什么?
活动时间:日-3月18日活动奖励:选取优质回帖会员,赠送技术图书。
发表于31楼
1.云计算时代,运维人员是否会面临着失业的风险?
以上说的是整体的国内运维趋势
如今云计算时代 对运维保障的要求自然更上一个台阶
失业不失业完全取决于自己.
2.传统的数据中心里,设备是真实存在的,管理起来相对简单,而虚拟化技术将这些资源都“池化了”,一旦故障发生,需要检查排除,云时代下您觉得在运维管理方面存在哪些痛点困扰呢?
既然使用到了虚拟化技术 那这个是具体问题具体分析
3.对云计算而言,一大 ...
发表于28楼
1.云计算时代,运维人员是否会面临着失业的风险?
在it圈里技术的革新总是很快的,当你跟不上技术的发展的时候。你永远面临着淘汰。原来的vb,daifei,等等。传统的运维注定被淘汰。自动化运维会持续发展
2.传统的数据中心里,设备是真实存在的,管理起来相对简单,而虚拟化技术将这些资源都“池化了”,一旦故障发生,需要检查排除,云时代下您觉得在运维管理方面存在哪些痛点困扰呢?
新的数据中心虽然池化了,但是他对应 ...
发表于27楼
1.云计算时代,运维人员是否会面临着失业的风险?
如果有自动化运维的,那么运维人员的要求更加高,而且压力也越来越大,技能还要提升。如果没有自动化运维,那么运维人员不仅不会失业,而且人员还要不断增加。
2.传统的数据中心里,设备是真实存在的,管理起来相对简单,而虚拟化技术将这些资源都“池化了”,一旦故障发生,需要检查排除,云时代下您觉得在运维管理方面存在哪些痛点困扰呢?
全面监控难度大,而且问题排查不 ...
发表于24楼
1.云计算时代,运维人员是否会面临着失业的风险?
不会,云平台也需要有人运维,云计算时代产生的云平台运维新岗位比普遍运维更重要,工资还高了。但对于一般性的非IT企业的某些基础架构类IT运维人员,是存在失业的风险,需要加紧转型。
2.传统的数据中心里,设备是真实存在的,管理起来相对简单,而虚拟化技术将这些资源都“池化了”,一旦故障发生,需要检查排除,云时代下您觉得在运维管理方面存在哪些痛点困扰呢?
资源都 ...
发表于16楼
1.云计算时代,运维人员是否会面临着失业的风险?
还奉行老思路吃老本的大龄运维,其实已经相当危险了,存在感将不断下降,手工作坊式的低技术含量运维将越来越out。建议年轻入行的运维,一定要多学点开发技术,光会用几个开源工具,养不起老婆孩子的。
2.传统的数据中心里,设备是真实存在的,管理起来相对简单,而虚拟化技术将这些资源都“池化了”,一旦故障发生,需要检查排除,云时代下您觉得在运维管理方面存在哪些痛点困 ...
很多初级运维人员估计没有活干了吧 经验丰富的又比较紧缺
1.云计算时代,运维人员是否会面临着失业的风险?
这个是肯定滴,现在的趋势就和农民种地类似,整体的岗位数量在下降,每个人管理的“田地”(服务器等IT资源)在增加。小型企业的运维人员需求(哪怕是兼职的网管)也在减少,小公司会把大部分的IT运维迁移到一些公有云上,管理简单,成本也可以接受。中型企业可能也会用公有云和部分自己的服务器,至于大型公司,基本 ...
&&nbsp|&&nbsp&&nbsp|&&nbsp&&nbsp|&&nbsp&&nbsp|&&nbsp
加菲猫也是猫
UID空间积分0 积分9895阅读权限90帖子精华可用积分9895 信誉积分3651 专家积分0 在线时间7849 小时注册时间最后登录
腰缠万贯, 积分 9895, 距离下一级还需 105 积分
帖子主题精华可用积分9895 信誉积分3651 专家积分0 在线时间7849 小时注册时间最后登录
认证徽章论坛徽章:126
活动奖励:选取优质回帖会员,赠送技术图书。
出现问题,周末了还要加班
上海 苏州求职,互联网技术lamp etc,重要的是饭碗,不是技术。
/invite?id=46200
UID802608空间积分0 积分3887阅读权限50帖子精华可用积分3887 信誉积分1789 专家积分0 在线时间1302 小时注册时间最后登录
小富即安, 积分 3887, 距离下一级还需 1113 积分
帖子主题精华可用积分3887 信誉积分1789 专家积分0 在线时间1302 小时注册时间最后登录
认证徽章论坛徽章:17
板凳做一做.......
多读书,少看电影
UID802608空间积分0 积分3887阅读权限50帖子精华可用积分3887 信誉积分1789 专家积分0 在线时间1302 小时注册时间最后登录
小富即安, 积分 3887, 距离下一级还需 1113 积分
帖子主题精华可用积分3887 信誉积分1789 专家积分0 在线时间1302 小时注册时间最后登录
认证徽章论坛徽章:17
&&说到自动化运维的事情,我现在就负责100多台X86服务器,可能是十几台服务器构成一个集群,然后对这个集群做统一操作。
由于现在还没有自动化运维的工具,只能是一个一个的进行操作,时间消耗很长。
& &如果靠自己去编一个自动化运维的软件,对我来说有些困难了,现在就想着如果有成功的软件,推动客户去购买,这样运维起来就比较方便快捷了。
多读书,少看电影
UID空间积分0 积分2072阅读权限50帖子精华可用积分2072 信誉积分2791 专家积分0 在线时间1642 小时注册时间最后登录
小富即安, 积分 2072, 距离下一级还需 2928 积分
帖子主题精华可用积分2072 信誉积分2791 专家积分0 在线时间1642 小时注册时间最后登录
认证徽章论坛徽章:38
本帖最后由 forgaoqiang 于
12:34 编辑
很多初级运维人员估计没有活干了吧 经验丰富的又比较紧缺
1.云计算时代,运维人员是否会面临着失业的风险?
这个是肯定滴,现在的趋势就和农民种地类似,整体的岗位数量在下降,每个人管理的“田地”(服务器等IT资源)在增加。小型企业的运维人员需求(哪怕是兼职的网管)也在减少,小公司会把大部分的IT运维迁移到一些公有云上,管理简单,成本也可以接受。中型企业可能也会用公有云和部分自己的服务器,至于大型公司,基本上都在维护自己的私有云,几乎不会使用其它公司的服务。
所以整体来说,工作岗位数量在下降,但是对于运维人员的技能要求却在上涨,运维开始成为高大上的职业,只有真正具有高技能的运维人员不会面临失业,而是面临涨工资。
2.传统的数据中心里,设备是真实存在的,管理起来相对简单,而虚拟化技术将这些资源都“池化了”,一旦故障发生,需要检查排除,云时代下您觉得在运维管理方面存在哪些痛点困扰呢?
个人感觉云时代的时候更像是一个统计学的结论,只要集群整体运行正常就算是正常了,对于“池”中的某条“鱼”(硬件设备)死了,可以短暂的不用去理会,定期替换维修即可。云时代下大家都是看着各种“仪表盘”来进行管理,很少关心底层的硬件,经过层层抽象导致的结果就是排查难度上升,需要一层一层的去检查,最终故障很有可能发生在最下一层的物理层次上。
3.对云计算而言,一大堆机器和设备放在一起,安全成为了一大挑战。有哪些监控工具可以实现对资源的管理,对网络流量、CPU利用率、进程、内存等状态监控呢?
工具非常多,很多商业化的工具、开源的管理工具等等,比较经典的仍然是 Zabix、Cacti 等开源监控程序,同事Puppet等管理工具也具有监控功能,这些工具都是开源的,能够根据自己的需要进行定制,很多支持插件模式,可以使用很多其它人已经开发好的插件完成一些个性化的需求,完整整个运维的监控工作。
4.在使用云服务,比如阿里云、腾讯云等,磁盘用到一定时候就会不稳定,很莫名其妙,磁盘I/O会变慢,到底是什么原因?您是否遇到过类似的经历?当时是如何解决的?
是的,这个情况的确有遇到,很多时候是因为自己的业务系统出问题了,整体来说感觉阿里云还是比较稳定和公正的,磁盘和CPU资源限制的比较准确,作为IaaS的基础设施,它们除了对硬件性能进行限制之外,剩下的都是客户的OS操作系统在处理自己的业务。对于I/O变慢的情况,好多都是自己的程序过度使用磁盘I/O造成的。
5.考虑到安全性问题,大多数企业都会选择混合云,选择IBM的云,稳定但贵,您比较看好哪些云服务提供商?为什么?
现在国内有多种云服务提供商,有些针对性的提供对 消息语音队列,有些是针对存储,有些则能够提供 平台托管,有些就是提供IaaS级别的,目前公司主要采用的服务是阿里云的,也考虑过腾讯云,看上去目前阿里是技术上做的最好的,SAE、BAE等平台不太适合我们的业务。对于消息队列还是比较看好 语音云 这家提供商。至于基础设施类的,个人感觉还是vmware或者xenserver的比较靠谱,但是费用高昂,中小型公司不会采用。
对于中大型企业应该会采用商用的私有云服务,但是对于阿里、腾讯、百度,它们应该是完全自主的云管理系统。
UID空间积分0 积分29阅读权限2帖子精华可用积分29 信誉积分60 专家积分0 在线时间64 小时注册时间最后登录
帖子主题精华可用积分29 信誉积分60 专家积分0 在线时间64 小时注册时间最后登录
论坛徽章:0
提示: 作者被禁止或删除 内容自动屏蔽
签名被屏蔽
UID空间积分0 积分4927阅读权限100帖子精华可用积分4927 信誉积分1339 专家积分0 在线时间1430 小时注册时间最后登录
帖子主题精华可用积分4927 信誉积分1339 专家积分0 在线时间1430 小时注册时间最后登录
认证徽章论坛徽章:26
支持一下。
学会与内心深处的你对话
问问自己想要怎样的人生
UID空间积分0 积分9322阅读权限100帖子精华可用积分9322 信誉积分1945 专家积分0 在线时间1356 小时注册时间最后登录
帖子主题精华可用积分9322 信誉积分1945 专家积分0 在线时间1356 小时注册时间最后登录
认证徽章论坛徽章:17
1.云计算时代,运维人员是否会面临着失业的风险?会,不思进取,不转变思路的运维人员会被淘汰。并不是所有的应用和业务都会放在云平台,但是云时代的来临也带给了我们很多机会,比如以前想搭建个人博客相对麻烦,现在有很多方便又快捷的云平台方案。
2.传统的数据中心里,设备是真实存在的,管理起来相对简单,而虚拟化技术将这些资源都“池化了”,一旦故障发生,需要检查排除,云时代下您觉得在运维管理方面存在哪些痛点困扰呢?
感觉把以前的实体机放在云里的困扰是如果自己能看得见摸得着,很多问题自己登陆上去分析一下可以采取及时合理的方法处理,放在云平台上的话,很多事情自己控制不了。
3.对云计算而言,一大堆机器和设备放在一起,安全成为了一大挑战。有哪些监控工具可以实现对资源的管理,对网络流量、CPU利用率、进程、内存等状态监控呢?
有很多工具可以用商业公司推出的有,开源的也有很多很好用的,用啥工具都OK,关键是能根据数据判断压力情况和性能需求。
4.在使用云服务,比如阿里云、腾讯云等,磁盘用到一定时候就会不稳定,很莫名其妙,磁盘I/O会变慢,到底是什么原因?您是否遇到过类似的经历?当时是如何解决的?
没注意到有这种情况,做IT不容易,云里的人同样也不容易,偶尔的小问题,过去就算啦,大家都别太辛苦,互相体谅吧。
5.考虑到安全性问题,大多数企业都会选择混合云,选择IBM的云,稳定但贵,您比较看好哪些云服务提供商?为什么?
没有特别看好的云服务提供商,每个云平台都有自己的优势,找到合适的就好。
IT Blog:& &gaoqiang.blog.chinaunix.net
优酷网认证音乐牛人: EricGuitar
UID空间积分0 积分112阅读权限10帖子精华可用积分112 信誉积分106 专家积分0 在线时间14 小时注册时间最后登录
白手起家, 积分 112, 距离下一级还需 88 积分
帖子主题精华可用积分112 信誉积分106 专家积分0 在线时间14 小时注册时间最后登录
认证徽章论坛徽章:0
小企业舍不得投入&&云计算好遥远
UID空间积分0 积分5029阅读权限100帖子精华可用积分5029 信誉积分3042 专家积分0 在线时间2109 小时注册时间最后登录
帖子主题精华可用积分5029 信誉积分3042 专家积分0 在线时间2109 小时注册时间最后登录
认证徽章论坛徽章:78
感觉这个转变就类似于从自己装机转变到使用品牌机一样,用了云服务就可以享受云提供商的各种支持。传统企业的计算机运维是在用户使用计算机过程中发现故障之后,通知运维人员,再由运维人员采取相应的补救措施。运维人员日常大部分时间和精力都花在处理简单且重复的问题上,而且由于故障预警机制不完善,往往是故障发生后才会进行处理,这种情况使运维人员的工作经常处于被动“救火”状态,这种被动的运维模式让IT部门疲惫不堪。运维质量如何提高?生产部门能对运维部有满意的评价吗?
哪种监控工具才是运维人的最爱?
那些指标需要监控?我能监控到什么?能监控到何种程度?或许这些问题连你自己都难说清楚。先看看运维兄弟们的现状。
.运维现状
传统企业的计算机运维是在用户使用计算机过程中发现故障之后,通知运维人员,再由运维人员采取相应的补救措施。运维人员日常大部分时间和精力都花在处理简单且重复的问题上,而且由于故障预警机制不完善,往往是故障发生后才会进行处理,这种情况使运维人员的工作经常处于被动“救火”状态,这种被动的运维模式让部门疲惫不堪。运维质量如何提高?生产部门能对运维部有满意的评价吗?
目前我们在运维管理过程中缺少明确的角色定义和责任划分,以及自动化的集成运维管理平台,以至于问题出现后很难快速、准确地找到原因,而且在处理故障之后也缺乏必要的跟踪与记录。
.隐藏在流量背后的秘密
网络接口的通端,流量的大小,已满足不了目前运维故障排除的需要。我们需要将流量分析的更深入,更细致。
图传统流量监控工具看表象
很多漏洞利用攻击、攻击都混杂着正常流量进入企业网层层防护关卡。要想知道每个数据包中携带了什么内容,普通的摄像头已经失效,需要更强大的透视相机-进行协议分析,只有准确理解事物的本质,才能对症下药,Shellcode攻击(下图是shellcode和botnet的实例)和各种蠕虫也是如此。
大数据时代下安全运维的新挑战
运维工程师们在大数据时代,下面对大量网络安全事件,若没有有效工具是无法完成分析工作,他们往往面对如下挑战:
& 每天出现巨大数量的安全报警,管理员很难对这些报警做出响应。
& 误报严重,管理员无法准确判断故障。
& 大量重复、零散而没有规律的报警,黑客的一次攻击行动,会在不同阶段触发不同安全设备的告警,这样导致报警数据之间在时间和空间上存在大量重复数据,如果不实现安全事件的关联处理,就无法有效的提高告警质量。
当出现这些问题的部分原因是企业缺乏事件监控和诊断等运维工具,因为如果没有高效的管理工具支持,就很难让故障事件得到主动、快速处理。市面上有很多运维监控工具,例如商业版的、、以及专注故障监控的,在开源领域有、、、、Zenoss、、等。由于它们彼此之间没有联系,即便是你部署了这些工具,很多运维人员并没有从中真正解脱出来,原因在于目前的技术虽然能够获取计算机设备、服务器、网络流量,甚至数据库的警告信息,但成千上万条警告信息堆积在一起,让人根本没办法判断问题的根源在哪里,缺乏对信息进行筛选、数据挖掘的能力其实我们并不缺少工具,商业的也好,开源的也吧,一抓一大把,为什么还是用不好?真正缺少的是分析数据的智能化。
另外我们的查看各种监控系统需要多次登录,查看繁多的界面,更新管理绝大多数工作都是手工操作,即使一个简单的系统变更或更新,往往需要运维人员逐一登录系统,当设备数量达到成百上千时,其工作量之大可想而知。而这样的变更和检查操作在运维中往往每天都在进行,这无疑会占用大量的运维资源。因此,运维工作人员需要统一的集成安全管理平台已迫在眉睫。
过去仅靠几个“技术大拿”来包打天下已不能满足要求,企业需要一种安全的运维平台,满足专业化、标准化和流程化的需要来实现运维工作的自动化管理。因为通过集成监控系统能及时发现故障隐患,主动的告诉用户需要关注的资源,感知网络威胁,把故障消除在萌芽状态。这极大降低了运维人员的工作负担,最大限度地减少维修时间提高服务质量。
.人工整合开源工具
既然找不到合适的,我们就把常用的开源工具集成到一个Linux平台,这不是就实现统一管理平台了吗?
人工整合开源监控系统的难点:
& 软件和依赖依赖问题难以解决。
& 各子系统界面重复验证和界面风格问题。
& 各子系统数据无法共享。
& 无法实现数据之间关联分析。
& 无法生成统一格式的报表。
& 缺乏统一的仪表板来展示重要监控信息。
& 无法对网络风险进行检测。
& 各子系统维护难度,增大了运维成本。
& & 实践中发现,这种方案首先遇到了性能问题,一些脚本周期性消耗了较多的和资源,所以无法做到实时数据分析。试想有多少且能投入大量人力、时间去开发一个未知的监控平台?
.集成安全运维平台的选择
一个好的安全运维平台需要将事件与流程相关联,一旦监控系统发现性能超标或出现宕机现象,就会触发相关事件以及事先定义好的流程,自动启动故障响应和恢复机制。还需要能够筛选出运维人员完成日常的重复性工作,提高运维效率。要实现这些功能都是常规监控软件、所无法实现。
同时,还要求能够预测网络蠕虫威胁,在故障发生前能够报警,让运维人员把故障消除在萌芽状态,将所产生损失减到最低。总的来说运维人需要能够在一个平台中实现资产管理、分布式部署、漏洞扫描、风险评估、策略管理、实时流量监控、异常流量分析、攻击检测报警、关联分析、风险计算、安全事件告警、事件聚合、日志收集与分析、知识库、时间线分析、统一报表输出、多用户权限管理的功能,这种集成开源工具到底有没有?它去哪儿啦?
目前市面上有两种产品可满足这样的要求,目前市面上的产品主要有(后台挂库)、和的,现在的问题是并不缺少商业解决方案,在开源软件中到是最佳选择。
很多人只是肤浅的认为只是将一些开源工具集成到一个平台,在中颠覆性创新主要在易用(容易安装、部署,容易使用,几乎不用自己写脚本)、分布式监控系统、响应威胁()、关联分析引擎、可视化攻击展示等。
分为开源和商业版两种,通过这一集成监控工具实现对用户操作规范的约束和对计算机资源进行准实时监控,包括服务器、数据库、中间件、存储备份、网络、安全、机房、业务应用等内容,通过自动监控管理平台实现故障或问题综合处理和集中管理。
&&&& 如果你即不想购买昂贵的商业软件,又不愿意投入大量精力进行开发,那么实现集成安全管理平台OSSIM就是唯一的选择。
&&&&&& 好了,我们看看OSSIM能够为你带来怎样的体验?
& & &看完后,有何感言?如果你想系统学习OSSIM,请关注我即将出版的第四本专著
《开源安全运维平台--OSSIM最佳实践》。
& 开源中国(OSChina.NET) |
开源中国社区(OSChina.net)是工信部
指定的官方社区

我要回帖

更多关于 运维监控软件 的文章

 

随机推荐