咿思舞论坛〖硬件平台〗『基础知识』 → 局域网故障诊断与排除


  共有395人关注过本帖树形打印

主题:局域网故障诊断与排除

美女呀,离线,留言给我吧!
admin
  1楼 个性首页 | 博客 | QQ | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:管理员 帖子:853 积分:1008523 威望:1000000 精华:12 注册:2003/12/30 16:34:32
局域网故障诊断与排除  发帖心情 Post By:2009/12/7 16:16:47

该文涉及的网络是指局域网,包括局域网内的所有服务器,PC、网络设备和与之相连接的网络线路。针对相关的故障类型,初步做出判断,并进行故障排查,定位故障点,排除故障。
  1 常用方法
  网络故障经常用到的方法为:排除法则、替换法则、和隔离法则。同时需要对于来自各个方面的诊断信息加以分析、判断、综合。由于信息不对称等原因,有些部分反馈回来的信息和真实情况有差距,甚至是错误的,直接采用这样的信息进行故障排查很容易被错误地指引到歧路中,距真实故障点越走越远。而且需要注意的是,有时候网络中会同时出现两处以上的故障点,对于此类现象需要更}人真仔细的检查。
  2 故障案例
  首先通过一个比较极端的故障实例,并且把许多其他故障包含到此实例中一并研究。
  局域网内任何两台PC机都无法相互访问,并且和本局域网内路由器以及交换机都不能Ping通。此现象为网络全部瘫痪,无法进行任何联网操作。
  此问题的分析判断方法:因为网络全部瘫痪,基本的网络连接无法运行,因此该问题的重点是如何快速恢复网络系统正常运行,而找到具体故障点到在其次。因为所有PC都无法相互访问,所以无法直接用机房的PC进行故障排除。
  3 排除思路
  首先保留核心路由器快速以太网和核心交换之间的连接线,核心交换机上其余的网线(多数是连接到服务器和其他级联交换机,因此做好标记很重要,可以在故障排除后快速按照原来的顺序恢复)全部做好标记后拔掉。单独连接一台PC到核心交换机,用陔PC检测路由器交换机是否正常。
  检测工作进行到达里存在以下若干排列组合的可能出现:PC无法ping通路由器,PC无法ping通交换机(如果交换机是可网管的,并且配置IP地址),PC可以访问交换机但无法访问路由器,PC可以正常访问路由器和核心交换机。
  首先假设PC无法访问交换机,怀疑核心交换机有故障,检测步骤为将两台状态良好的、不开启软件防火墙(或者有防火墙但开启了icmp进栈、出栈许可)的 PC连接到核心交换机的同一个模块(交换机通常情况下一组端口属于一个交换模块,各模块可以独立工作,因此存在部分端口故障,而其他端口正常的可能)的不同端口上,如果可以相互访问,则交换机该模块工作正常,反之则找到一处故障点,用备机替换,由于日前各学校核心交换机部分是采用纯二层交换机,因此替换过程也比较简单,并不需要对备用设备进行配置即可使用。对于某些学校交换机采用背板堆叠方式,参与堆叠的部分损坏不影响其他部分正常工作,该形式的故障还有可能是堆叠线缆故障,因此对于堆叠线缆也需要进一步检测,可以用替换方法。
  将核心交换机检查完毕后,我们要检测核心路由器是否有故障。如果PC可以ping通路由器快速以太网口地址(通常情况是本局域网网关地址),则目前连接部分状态正常,需要考虑是否征原来网络中有arp欺骗行为出现、或者是二层链路环路引起的局域网广播风暴产生。如果PC不能ping通路山器,需要用PC通过console配置线登录路由器检查eth端口状态。
  在检查端口状态之前,首先要排查路由器和核心交换机之间的连接线是否正常检测网线质量是一项基本功,检查线序(无论是直连线还是交叉线,都必须严格按照国际组织EIA/TIA制定的568A和568B的线序规则制作,不允许有其他的接线形式,简单来讲:可以最人程度地减低方形RJ45接头处的近端串扰数值,并且在满是一定条件的情况F可以直接过渡到1000M网络系统,同时也能更好地支持100M全双工模式的运行,而其他连接形式则不能满足以上的功能,而仅仅是能做到ping通而己。)和RJ45接头质量(水晶头的制作也有规范,尽量采用质量好的水品头,尤其是核心网络部分,主要检查的地方是:水晶头前部铜片是否完全切入到网线中,即是否与铜线有良好的接触;固定用塑料楔型卡子是否将网线外部塑料皮牢固固定。原因是如果水晶头铜片和网线铜线接触不良,则电平信号会传导不良,容易出现数据包错误从而影响通讯质量。如果楔型卡子仅仅是将裸露的8根网线固定住而没有将网线外部塑料皮固定,那么当网线受外力拉伸时,受力的将是8根网线,头部的铜线和金属片将很容易接触不良,并且由于直接受力的原因,双绞线的绞率也会部分有所改变,从而也对通讯产生不良影响)、网线本身是否有破损和曲率过大现象存在。曲率要求住光纤连接上非常严格,弯曲过度率会导致光路全反射失效或者光纤本身折断,而对于五类超五类非屏蔽双绞线系统,过度的弯曲也会造成铜丝损坏,引起局部电阻变化、或者绝缘问题出现。
  确认网线连接没有问题后,我们通过console控制线登录路由器,目前多数学校使用的都是华为-3Com(H3C)的产品,但其产品按照操作系统版本不一样,其具体的命令行的肜式略有不同,但基本原理都相同,所以我们按照多数版本通用的命令行进行讲解。
  用路由器举例说明:
  其中,主要的是Errors:错误、runts:小帧、giants巨帧、crc:包完整性交验、align errors:排列错误、overruns:溢出、drops:丢弃、no buffers:没有缓冲、broadcasts:广播、multicasts:组播、pauses:暂停帧。Dribbles是新出的参数,也不是所有设备上都有这个指标。
  Overruns:溢出
  Underruns:芯片需要发送,但接口未准备好发送该数据。
  Dribbles:
  Deferred:延缓发送
  Lost carriers:丢失载波
  通常情况下,局域网只会占用路由器一个以太网端口,在确定是路由器以太网端口故障的前提下可以临时配置另一个端口代为工作。注意要将故障端口的IP地址取消并且禁用。
  在排除完成路由器和核心交换机出现故障的肯能性后,我们先将服务器组全部连接到核心交换机上,同时检测PC对于服务器、交换机、路由器的访问情况。如果访问正常,则核心网络故障排除,如果不正常,则连接的服务器有可能柯问题而影响整个网络。这样就只需要将服务器逐个排除即可,有一些Windows服务器由于杀毒软件和补丁更新不及时,很有可能成为故障点,而且服务器的通讯能力和处理能力要普遍高于PC,因此如果出现故障,则影响面会较PC更大。
  在恢复了核心局域网络部分的工作状态后,我们接F来是要将各个楼层的级联线逐个接入到核心交换机,接入的同时继续检测PC对于服务器、交换机、路由器的访问情况。如果当接入某一个级联线后,网络出现故障,则问题会被缩小钊该级联线以下的较小范围内,同时其余楼层没有问题的级联线可以都接入核心交换机,从而在最大程度上恢复网络系统的正常运行。
  接下来我们就要判断有问题的级联线分支故障原因。在被级联的交换机旁放置一台笔记本或者PC机,将级联线和被级联交换机连接,该交换机其他网线撤除,将 PC接入该交换机检查情况。如果无法访问服务器,则有可能级联线有问题,无论是用超五类线还是光电转化器,交换机级联线应该都用冗余,更换另一条备用线路来排除故障。
  级联线的问题排查完毕后,将陔交换机的连接线依次恢复连接,同时用PC持续检测对于服务器、交换机、路由器的访问情况,如果恢复到某一条连接时,整个网络出现故障,则问题会进一步被缩小到该网线以下连接的部分。
  问题到这一步可能有以下两个方面出现故障,(1)对于没有开启stp(生成树)或者mstp(多生成树)的二层网络出现广播风暴;(2)arp地址欺骗。
  第一种情况是局域网络中出现物理环路现象,我们可以做一个简单的试验,就是把普通网线的两央同时连接到正常运行的同一台交换机上,我们可以看剑交换机所有端口的灯都任快速的I司一频率的闪烁。如果登录到交换机上看,其CPU利用率将会是95%以上。原因是从一个端口发送的广播数据包很快被另一个端口接受,并再次扩展为交换机全端口数量再次发送,如果交换机有24个端口,则广播循环一次期数量就被放大成为原来的24倍,这种数据报以每次24倍的速率递增,结果整个网络很快就被无用的广播数据报所淹没,即通常意义上所讲的广播风暴。
  广播风暴出现的情况何以下几种:(1)网络错误接线造成,在事实上造成了上面例子所描述的情况,同一网线两头连接到同一交换机E,或者不同交换机之间有环路形成。(2)同一网线中有短路存在。
  这里需要特别强调的是第二种情况,目在某些学校或单位中,多存在劈线或者分线的情况(可以有效降低布线成本),就是将一条八芯网线,4线用于局域网连接,另外两对四条线再接一部或者两部电话。
  网线的制作规范,和不按照规范所引发的问题在之前的部分已经涉及到了,在这里就不再赘述。我们来看分出的电话线部分,在分线的时候要割破网线外部塑料套,操作的时候不小心就会割破铜线的绝缘层,造成两条线路短路,从而产生环路。对于一条网线只连接一部电话和一个局域网点的情况,还会有两股铜线悬空裸露,线头之间的相互触碰也会造成线路环路。因此分线这种做法,在于局域网搭建中是非常有害的一种行为,应该极力避免。如果迫不得已而必须要采用此种方法的时候,请务必要认真检查绝缘情况,对于裸露的线头要用绝缘黑胶布包裹好。
  短路状况的出现还和配线架有关,我们在向配线架上打线的时候,状态良好的打线钳子可以把多余的线头全部切掉,但是在多数情况下由于打线钳子磨损,多余的线头无法切除,因此有些操作员用裁纸刀进行线头固定,这样就更不能将多余的线头切除。铜线的多余部分如果过长,则无意中相互触碰,也会造成短路。因此配线架上多余的线头部需要清理,打落的小段金属线也要及时清扫。
  对于个别PC联网问题,我们可以这样考虑:首先,如果更换了一台在其他位置联网正常的PC到有问题的网点后测试还是丢包严重(或者有问题的网点上的PC,更换到其他地方联网正常),说明跟PC机关系不大,需要检查线路问题。如果局域网中有部分PC都出现时断时续的现象,可能网中有病毒,需要确定病毒原将其隔离;如果只有这一个网点时断时续,要考虑从弱电井到PC的线路问题。弱电井的相应跳线重新制作,看是否故障消除。未消除则更换交换机插口再检测。未消除则在检查网线是否8根线都是连通的。都连通,而故障还未消除,则再重新更换墙点模块,和接入网线再检测。这样,局域网故障及排除方法就大体总结到这里。

论坛帖间随机广告 支持(0中立(0反对(0单帖管理 | 引用 | 回复 回到顶部

返回版面帖子列表

局域网故障诊断与排除








签名