交换机常见故障分类与排除方法

交换机在网络建设中使用得非常普遍。与此同时在日常工作中,交换机故障的现象是多样的,故障的原因也是多样的,本文将交换机分为硬件和软件故障,并针对性地进行分析,逐类排除。

一、交换机故障分类:

交换机故障一般可以分为硬件故障和软件故障两[ c { * ]大类。硬件G ( u u q 4 P故障主要指交换机X Y a ; I Z b \ x电源、背板、模块、端口 等部件的故障,可以分为以下几类。

(1)电源故障:

由于外部供电不稳定,或者电源线路老化、静电或者雷击等原因导致电源损R 7 [ s ` x g s %坏或者风扇停止,从_ u 1 Y @ I $而不能正常工作。由于电源缘故而导致机内其他部件损坏的事情也经常发生。

针对这类故障,首先应该做好外部电源的供应& E j工作,通过引入独立的电力线来提供K Q N独立的电源,并添加稳压器来避免瞬间高压或低压现象。一般来说,n k k h : S x i R有两路电供电,但由于各方面的原因,不可7 Z i能为每台交换机提供双路供电,可以添加UPS(不间断电源)来保证交换机的正常供电,最好使用提供稳压功能的UPS。另外还要在机房内设置专业的避雷措施,来避免雷电对交换机的伤害。

(2)端口故障:

这是最常见的硬件故障,无论是光纤端口还是双绞线的R/ 3 s A z 5 D _J-45端口,在插拔接头时一定要小心。如果不小+ ~ t !心把光纤插头弄脏,可能导致光纤端口污染而不能正常通信。我们经常看到很多人喜欢带电插拔接头,理论上讲是可以的,但是这样也无意中增加了端口的故障发生率。在搬运时不小心,也可能导致端口物理损坏。如果购买的水晶头尺寸偏大,插入交换机时,也容易破坏端口。此外,如果接在端口上的双绞线有一段暴露在室外,万一这根电缆被雷电击中,就会导致所连交换机端口被击坏,或者造% j ~ = t p X _成更加不可预料的损伤。

一般情况下,端口_ 8 =故障是某一个或者几个端口损坏。所以,在排除了端口所连计算机的故障后,可以通过更换所连端口,来判断其是否损坏。遇到此类故障,可以在电源关` # Q闭后,用酒- Q O ] y精棉球清洗端口。如果端口确实被损坏,那就只能更换端口了。

(3)模块故障:

交换机是由很多模块组成,比如:堆叠模f ) z & B ~ p 2块、管理模块(也叫控制模W 3 & 5 Z块)、扩展s L ! 1 1模块等。这些模块发生故障的机率2 o l很小,不过一旦出现问题,就会遭受巨大的经济损失。如果插拔模块时不小心,或f U 7 # 1 % T :者搬运交换机时受到碰撞,或者电源A ! Y不稳定等情况,都可能导致此类故障的发生。

当然上面提到的这3个模块都有外部接口,比较容易辨认,有的还可以通过模块上的指示灯来i r K $ u辨别故障。比如:堆叠模块上有一个m m n o扁平的梯形端口,或者有的交换机上是一个类似于USB的接口U \ x 1 h r。管F ) 6 N E ( E理模块上有一个CONSOLE口,用l x } s于和网管计算机建立连接,方便管理。如果扩展模@ B m #块是光纤连接的话,会有一对光纤接口。

在排除此类故障时,首先确保交换机及模块的电源正常供应,然后检查各个模块是否插在正确的位置上,最后检查连接模块的线缆是否正常。在连接管理} 5 K N |模块时,还要考虑它是否采用规定的连接速率,是否有奇偶校验,是否有数据流控制等因素。连接扩展模块时,需要检查是否匹配^ o m p 6通信模式,比如:使用全双工模式还是半双工模式。当然如果确认模块有故障y L 6 s b T ] L 7,解决的方法只有一个,那& R $就是应当立即联系供应商给以更换。

(4)背板故障:

交换机的各个模块都是接插在背板上的。如果环境潮湿,电路板受潮短路,或者元器件因高温、雷击等因素而受损都会造成电路板不能正常工作。比如+ x f K h : 0:散热性能不好或环境温度太高导致机内温度升高,指使元器+ _ h z件烧坏。

在外部电源正常供电的情况下,如果交换机的各个内部模块都不能正常工作,那就可能是背板坏了,遇到F f ; I这种情况惟一的办法就是更换背板了。但硬件更新后,n A W同一名称的电路板块可能有多种不同的型I ~ F f \ a L Q号。本文由公众X & 1 G N T I q U号云极安整理,在一般情A h m } g r `况下,新型号电路板的功能会兼容旧型号电路板的功能。但旧型号的电路板的功能,就不一定能兼容新型号电路板的r y = h i Y * :功能了。

(5)线缆故障:

连接电缆和配线架的跳线是用来连接模块、机架和设备用的。如果这些l a 3连接电缆内的缆芯或跳线发生了短路、断路或虚接,就, % t ~会形成通信系统的故障。

从上面的几种硬件故障来看,机房环境不I 4 C $ w ; l M 2佳极易导致各种硬件故障,j 6 8所以医院在建设机房时,必须先做好防雷接地及供电电源、室Z 7 Q内温度、室; \ K内湿度、防电磁干扰、防静电等环境的建设,为网络设备的正常工作提供良好@ + _ a { 6 Y的环境。

二、交换机的软件故障:

交换机的软件故障是指系统及其配置^ - p p O R [上的故障,它可以分为以下几类。

(1)系统错误:

程序BUG:软件程序设计存在着缺陷。交换机7 9 k d : k \ G系统是硬件和软件的结合体。在交换机内R v F部有一个可刷新的只读存储器,它保存的是这Q y V L台交换机所必需的软件系统。由于当时设计的原因,存在一些漏洞,在条件合适时,会导致交换机满载、丢包、错包等情况的发生。

对于此类问题,我们需要养成f u = j经常浏览设备厂商网站的习惯,如果有新的系统推出或者新的补丁,请及时更新。

(2)配置不当:

由于各种交换机配置不一样6 - H 5 w 9 n,网络管理员往往在配置交p k & v 9换机时会出现配置错误。主要错误有:

1、系统数据错误:系] \ O 7 ] % 6 # R统数据,包括软件设置,用于对整个系统进行定义。如l n S - i Q $ p系统数据出现错误,也会造成系统全方位的故障,对整个交换局产生影响。

2、局数据错误:局数据是根据交换局的具体情况而定义的。当局数据出现错误时,也会对整个交换局产生影响。 

3、用户数据错误:用户数据对每一个用户的情况进行定义,如果用户数据被错误设置,会对某个用户产生影响。

4、硬件设置不合适:硬件设置是为减少电路板的0 - 7 k n $种类,而在电路板上设置的一组或几组开关,用以定义该电路板| K k m f的工作状态或在系统中所处位置x 6 :,如硬件设置得不正确,必会导致该电路板工作不正常。

这类故障有时很难发现,需要一定的经验积累。如果不能确定配置是否有问题,请先恢O ] F % =复出厂默认配置,然后再一步一步地配置。最好在配置之前,先阅读说明书。

(3)外部因素:

由于病毒或者黑客攻击等情况的存在,有r p j可能某台主机向所连接的端口发送大量不符合封装规则的数据包,造成交换机处理器过分繁忙,致使数据包来不及转发,进而导致缓冲区溢出产生丢包现象。还有一种情况U Y v l e就是广播风暴,它不] C c M 0 u 1仅会占用大量的网络带宽,而且还将占用大量的CPU处理时间。本文由公众号云极安整理,网络[ 4 o [如果长时间被大量广播数据包所占用,正常的点对通信就无法正常进行,X Q p Q A / R网络速度就会变慢或者瘫痪。

总之,软件故障应该比硬件故障较难查找,, s \ M _ , w解决问题时,可能不需要花费过多的金钱,而需要较多的时间。要网络管理员在平时的工作中养成记录日志的习惯。每当发生故障时,及时做好故/ W b障现象记录、故障分析过程、故障解决方案、故障归类总结等工作,以积累自己的经验。每解决一个问题后都用心的去回顾问题根源以及解决方法。这样才能不断的提高自己,更好的完成网络管理的重任。

© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享
评论 抢沙发

请登录后发表评论