如何高效排查系统网络故障排查

豆丁微信公众号
君,已阅读到文档的结尾了呢~~
监控单元常见故障快速排查手册,监控系统常见故障,电脑故障排查实例大全,网络故障排查,单元排查过三关 四,电脑故障排查,网络故障排查步骤,系统故障分析和排查,单元排查过三关,电脑硬件故障排查
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
监控单元常见故障快速排查手册
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='http://www.docin.com/DocinViewer--144.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口故障诊断方法
在电子工程世界为您找到如下关于“故障诊断方法”的新闻
故障诊断方法资料下载
在软件失效机理分析的基础上,提出了基于运行序列的软件故障诊断方法。该方法根据最近邻思想,采用编辑距离在大量正常运行中搜索故障运行的最近邻,利用故障运行序列与最近邻序列的对比差异生成程序可疑部分报告,并给出了报告的评价函数。最后设计试验验证了该方法。...
&&&&&&&& 故障诊断是人工智能的一个重要研究内容。在对故障树分析法的相关概念进行必要阐述后,就基于故障树分析法的智能型故障诊断方法进行了深入的分析与探讨,指出FTA 与其它人工智能技术相结合,建立高效、实用的故障诊断系统是故障诊断技术的主要发展方向之一。关键词:故障诊断;故障树;故障树分析法;人工智能&nbsp...
通过深入研究人工神经网络理论,探索神经网络技术在某型飞机自动飞行控制系统(CAY)故障诊断中的应用;建立由多个子模块组成的神经网络诊断系统模型,并选择其中一个模块进行设计与训练;训练后的神经网络能很好地对自动飞行控制系统已知故障模式进行识别,实现故障诊断。...
& 首先,针对电网故障诊断中应用较早的人工智能方法:专家系统、人工神经网络、Petri 网、模糊理论及优化方法,简要概括了它们所存在的问题,并对近几年的研究进展进行了文献评述。然后,对近几年引入电网故障诊断领域的方法:粗糙集理论、贝叶斯网络、数据挖掘,信息理论、多代理系统等,进行概念简介、文献述评,分析它们在电网故障诊断中应用的特点以及存在的主要问题 &...
提出了基于预测滤波器的非线性系统的系统故障诊断的方法, 并且给出了这种方法的故障可检测性条件, 故障的误检率和漏检率, 以及故障检测时间的上界. 通过对一个二阶非线性系统进行的仿真验证了这种方法的有效性. 结果表明预测滤波器用于故障诊断时, 具有较快的速度、较低的误检和漏检率, 并且在故障发生后仍然具有对系统状态的跟踪能力. 该方法提供的实时故障估计还可以用于在线故障补偿. &...
基于网络化传感器的远程设备监测与故障诊断方法研究...
文中介绍了基于专家系统的故障诊断方法,并着重研究了几种改进的专家诊断系统,分析了各自技术的特点和局限性,最后结合新技术的发展和应用对故障诊断专家系统的发展趋势进行了展望。...
期刊论文:一种基于小波神经网络的故障诊断方法...
&&&&&&&&EPON在安装、开通和故障诊断时都会面临如何进行现场测试的问题。本文所描述的EPON光纤链路现场质量检验是指采用一级测试方法(OLTS或LSPM法)对EPON光纤链路进行的检测,少数高可靠性用户则需进行网络传输性能检测。故障诊断则可能结合一级测试(损耗测试)、二级测试方法(增加了OTDR测试)、替代法...
由非线性电力电子装置组成的电路发生故障时,故障特征信息不易提取和识别。对此提出一种基于小波包分析和Elman神经网的电力电子装置故障诊断的方法,先运用小波包分析法提取电路在不同故障状态下电压及电流信号的特征信息,然后对数据进行归一化处理并作为Elman神经网的输入,由具有智能学习功能的神经元故障分类器完成故障识别和定位。以12脉冲整流电路为例,在Matlab软件下建立电路模型进行仿真实验...
故障诊断方法相关帖子
故障诊断方法视频
无噪声电源并非是偶然设计出来的。一种好的电源布局是在设计时最大程度的缩短实验时间。花费数分钟甚至是数小时的时间来仔细查看电源布局,便可以省去数天的故障排查时间。
图 1 显示的是电源内部一些主要噪声敏感型电路的结构图。将输出电压与一个参考电压进行比较以生成一个误差信号,然后再将该信号与一个...
你可能感兴趣的标签
热门资源推荐扫一扫体验手机阅读
微服务架构的链路追踪和故障快速排查zipkin(微服务治理)
<span type="1" blog_id="2074615" userid='
分享到朋友圈
关注作者,不错过每一篇精彩教你如何利用Ping命令去快速排查网络故障的原因
“电脑知识教你如何利用Ping命令去快速排查网络故障的原因”,希望可以帮助到大家,具体如下:
win7系统如何利用Ping命令去快速排查网络故障的原因?
一、点击系统中开始里的运行,在运行栏中输入cmd命令,操作系统中的DOS窗口就会弹出,在这里我们可以直观和方便地输入各种DOS命令。
二、在DOS里输入Ping 127.0.0.1,该地址是本地循环地址,如发现本地址无法Ping通,就表明本地机TCP/IP协议不能正常工作。
三、如果可以Ping通,输入IPConfig来查看本地的IP地址,然后Ping该IP(192.168.1.114),通则表明网络适配器(网卡或MODEM)工作正常,不通则是网络适配器出现故障。
四、然后Ping一台同网段计算机的IP,不通则表明网络线路出现故障;若网络中还包含有路由器,则应先Ping路由器在本网段端口的IP,不通则此段线路有问题;通则再Ping路由器在目标计算机所在网段的端口IP,不通则是路由出现故障;通则再Ping目的机IP地址。
五、检测一个带DNS服务的网络,在上一步Ping通了目标计算机的IP地址后,仍无法连接到该机,则可Ping该机的网络名,比如ping www.dnzsb.com -t命令,正常情况下会出现该网址所指向的IP,这表明本机的DNS设置正确而且DNS服务器工作正常,反之就可能是其中之一出现了故障;同样也可通过Ping计算机名检测WINS解析的故障(WINS是将计算机名解析到IP地址的服务)。
ping -t命令
六、通过上面这些步骤,我们可轻易判断出到底是某个环节出现了故障问题,该重新设置的设置,该换硬件的换硬件。
七、检测网络的连接情况,还可以在Ping的地址后面加上-t,这样可不断地进行Ping的连接,可反映出网络的连接是否有中断或者丢包的现象出现。
女人天生爱美丽ID:aimei3838
▲长按识别二维码关注
简介:爱美之心人皆有之,女以悦己者容。美丽的容颜对女性来说是一种优势,对别人来说是一种享受.做为朋友,我要告诉你,每天花上一个小时关注&女人天生爱美丽&,通过护理、皮肤,饮食、运动来维护和改善面容,必定会让你青春常在,美貌长存。
时尚辣妈 微信号:lama259
▲长按二维码“识别.”关注
简介:为了宝宝的健康,请关注我,这里有海量的育儿方面的知识,希望能与您分享和交流。
装逼大神微信号:zbds365
▲长按二维码“识别.”关注
简介:装B;在线装逼神器;装逼图片生成器;飞机驾照;保时捷购车单;楼宇表白装逼图片制作;1秒在线生成朋友圈装逼照片:进入公众号即可快速生成
责任编辑:
声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
今日搜狐热点如何高效排查系统故障?一分钱引发的系统设计“踩坑”案例
如何高效排查系统故障?一分钱引发的系统设计“踩坑”案例
阿里妹导读:阿里巴巴的电商业务十分复杂,一方面是市场多样化,业务多样化,另外是消费者,商家的影响面非常广,任何一个小故障都可能引发一些社会问题,所以阿里对产品的质量,对服务的连续性有严格的要求。阿里技术人员在日常的研发运维过程中,积累了丰富的实战经验。
阿里妹导读:阿里巴巴的电商业务十分复杂,一方面是市场多样化,业务多样化,另外是消费者,商家的影响面非常广,任何一个小故障都可能引发一些社会问题,所以阿里对产品的质量,对服务的连续性有严格的要求。阿里技术人员在日常的研发运维过程中,积累了丰富的实战经验。今天,阿里妹将为大家分享一个关于故障,排查,分析和改进的真实案例。他山之石可以攻玉,希望对广大开发和运维工程师带来帮助。
某日,做产品X的开发接到客户公司电话,说是对账出了1分钱的差错,无法处理。本着“客户第一”的宗旨,开发立马上线查看情况。查完发现,按照产品X当日的年化收益率,正常情况下用户在转入57元后一共收益3分钱,合计是57.03元。但是该客户当日却有一笔消费57.04元,导致客户公司系统对多出的1分钱处理不了。再进一步分析,发现用户收益结转时多了1分钱的收益,并且已消费……
也就是说,本来用户只有3分钱收益,结果多发了1分钱给他,也就给公司造成1分钱的损失!用户在产品X里当天收益本应该是0.03元,怎么会变成0.04元呢?多出的1分钱收益从哪里来的呢?
数据库记录分析
带着上面的一系列疑问,开发人员首先排查了产品X收益的数据库记录。通过查询数据库发现,该用户收益结转在同一天内存在2笔交易记录。交易记录1创建时间为8:00:23,记录2创建时间为8:00:29,交易记录1和2的最后修改时间均为8:00:29,如图4-1所示。
图4-1 用户当日收益结转数据库记录分析
正常情况下产品X收益每天只会结转一次,而这个用户当日有两笔收益结转记录。开发人员怀疑,很可能是出现了并发问题。
继续跟踪第一笔“TXID a”的记录,开发确认线上日志存在超时情况,失败原因是数据库链接数已满,线程等待提交。
分布式锁超时时间是5s,第一笔记录从创建到修改提交经历了6s,由此可见是在分布式锁失效之后,获得了数据库链接,进行提交成功。
有了以上三个排查思路后,我们可以开始逆推整个过程。
根据数据库记录逆推当时的运行情况,如图4-2所示。
(1)由于数据库连接数被占满,流水1创建的事务处于等待提交状态。
(2)系统A发现交易失败,重试次数不满8次的,立即发起重试,触发生成流水2的请求。
(3)5s以内数据均被分布式锁拦截,无法提交。
(4)经过5s后,系统B的分布式锁失效,此时事务仍在等待未提交。
(5)6s时,流水2成功越过数据库查询幂等校验发起事务,此时流水1拿到数据库连接,流水1和2两个事务同时提交。
(6)由于数据库未做唯一索引,且支付受理模块打穿下层幂等原则,生成2个TXID,导致两事务同时提交成功。
(7)收益结转重复记账,用户多了一笔收入。
图4-2 数据库分布式锁超时并发控制失效
完成了整个问题的过程逆推后,开发人员进一步分析,发现问题真正的原因还是在系统设计上。如图4-3所示,系统A的事务允许一定时间的等待,而上层业务的重试时间又比这个等待的时间要短。这就存在一个问题:系统A的事务还在等待中,业务就又发起了重试。如果是在这个应用场景下(可能业务上对重试要求更高一些),那么对幂等控制的要求就更高了。而仅仅通过一个分布式锁来控制,如果分布式锁的超时时间设置的比事务允许等待的时间短,那么在锁失效之后就一定会同时提交两笔请求。
图4-3 分布式锁超时并发控制时间轴
继续对整个过程抽象化,开发人员得出一个结论:分布式锁在以下条件同时满足的情况下并发控制会被打穿。
(1)上层业务系统层面有重试机制。
(2)业务请求存在一定时间之后提交成功的情况,例如本例中第一次请求在事务等待6s后获得了数据库链接,提交数据库成功。
(3)下游系统缺乏其他有效的幂等控制手段。
了解了问题的来龙去脉后,接下来要怎么解决这类问题呢?我们想了以下几个方案。
(1)调整B系统上的tr和分布式锁超时时间,tr超时调整为10s,分布式锁超时调整为30s。
(2)防止做收益结转产生并发控制幂等,调整了收益结转流水号的生成规则:前8位取X收益结转传入的交易号的前8位,第10位系统版本设置为“9”,最后8位seq取交易号的最后8位,降低问题出现几率。
方案一:调整超时时间
调整超时时间后,业务重试时间与分布式锁有效时间的分布时间轴如图4-4所示,即在事务允许等待后提交成功的时间之外,再进行重试,另外分布式锁在整个阶段均有效,防止提交。
图4-4 分布式锁超时并发控制时间轴
方案一验证有效。
方案二:增加幂等控制(推荐)
如图4-5所示,单纯靠分布式锁不是控制并发幂等的方式,最稳妥的方式还是在提交记录的时候通过数据库严格控制幂等。确保不论如何设置超时时间,都不会出现幂等控制的问题。
图4-5 分布式锁超时并发控制时间轴
方案二验证有效。
资金安全无小事,而幂等控制又是资金安全中的重中之重。回顾本文案例,从问题分析定位,到整个逻辑的梳理清洗,其中涉及了三个时间轴的相互作用,再加上事务、分布式锁、重试等,整个问题发生的逻辑还是比较复杂的。因此,在系统并发幂等控制设计中,单纯的分布式锁并不具备严格控制并发幂等的作用,建议在系统设计时,将第三方唯一性的幂等控制作为幂等控制的兜底方案,控制好这道幂等防线,这样不论业务如何设计,就万变不离其宗了。
作者:阿里巴巴集团成长集编委会
本案例选取自《逆流而上:阿里巴巴技术成长之路》。该书通过分享阿里中间件、数据库、云计算、大数据等各个领域发生的典型“踩坑”案例,帮助大家快速提升自我及团队协作,学习到宝贵的处理经验及实践方案,为互联网生产系统的稳定共同努力。有兴趣的童鞋可以在天猫、淘宝搜索、购买此书。
原文发布时间为:
本文作者:逆流而上
本文来自云栖社区合作伙伴“”,了解相关信息可以关注“x”微信公众号
用云栖社区APP,舒服~
【云栖快讯】《阿里巴巴Java开发手册》(详尽版)已经上线!您的Java学好了吗?如果没有,那就赶紧加入学习吧!&&
文章3578篇
结合大数据能力帮助电商企业快速搭建平台、应对业务高并发,剖析秒杀、视频直播等场景
充分利用阿里云现有资源管理和服务体系,引入中间件成熟的整套分布式计算框架,以应用为中心,帮助...
一种稳定、可靠、容量和服务能力可弹性伸缩的分布式关系型数据库服务。
为您提供简单高效、处理能力可弹性伸缩的计算服务,帮助您快速构建更稳定、安全的应用,提升运维效...
云数据库HBase2.0产品发布会

我要回帖

更多关于 电脑故障排查实例大全 的文章

 

随机推荐