排查步驟1:電源故障
由于外部供電不穩(wěn)定,電源線路老化或者雷擊等原因?qū)е码娫磽p壞或者風(fēng)扇停轉(zhuǎn),以致不能正常工作?;蛘哂捎陔娫淳壒蕦?dǎo)致機(jī)內(nèi)其他部件的損壞都會(huì)使工業(yè)交換機(jī)出現(xiàn)問題。如果工業(yè)交換機(jī)面板上的POWER指示燈是綠色的,就表示是正常的;如果該指示燈滅了,則說明工業(yè)交換機(jī)沒有正常供電。這類問題很容易發(fā)現(xiàn),也很容易解決,同時(shí)也是容易預(yù)防的。針對(duì)這類故障,首先應(yīng)該做好外部電源的供應(yīng)工作,一般通過引入獨(dú)立的電力線來提供獨(dú)立的電源,并添加穩(wěn)壓器來避免瞬間高壓或低壓現(xiàn)象。如果條件允許,可以添加UPS(不間斷電源)來保證工業(yè)交換機(jī)的正常供電,有的UPS提供穩(wěn)壓功能,而有的沒有,選擇時(shí)要注意。在機(jī)房?jī)?nèi)設(shè)置專業(yè)的避雷措施,來避免雷電對(duì)工業(yè)交換機(jī)的傷害。現(xiàn)在有很多做避雷工程的專業(yè)公司,實(shí)施網(wǎng)絡(luò)布線時(shí)可以考慮。
排查步驟2:端口故障
這是常見的硬件故障,無論是光纖接口還是雙絞線的RJ-45接口,在插拔接頭時(shí)一定要小心。如果不小心把光纖插頭弄臟,可能導(dǎo)致光纖接口污染而不能正常通信。我們經(jīng)??吹胶芏嗳讼矚g帶電插拔接頭,理論上講是可以的,但是這樣也無意中增加了接口的故障發(fā)生率。在搬運(yùn)時(shí)不小心,也可能導(dǎo)致接口物理?yè)p壞。如果購(gòu)買的水晶頭尺寸偏大,插入工業(yè)交換機(jī)時(shí),也容易破壞接口。此外,如果接在接口上的雙絞線有一段暴露在室外,萬一這根電纜被雷電擊中,就會(huì)導(dǎo)致所連工業(yè)交換機(jī)接口被擊壞,或者造成更加不可預(yù)料的損傷。一般情況下,接口故障是某一個(gè)或者幾個(gè)接口損壞。所以,在排除了接口所連計(jì)算機(jī)的故障后,可以通過更換所連接口,來判斷其是否損壞。遇到此類故障,可以在電源關(guān)閉后,用酒精棉球清洗端口。如果接口確實(shí)被損壞,那就只能更換接口了。
排查步驟3:模塊故障
工業(yè)交換機(jī)是由很多模塊組成,比如:堆疊模塊、管理模塊(也叫控制模塊)、擴(kuò)展模塊等。這些模塊發(fā)生故障的幾率很小,不過一旦出現(xiàn)問題,就會(huì)遭受巨大的經(jīng)濟(jì)損失。如果插拔模塊時(shí)不小心,或者搬運(yùn)交換機(jī)時(shí)受到碰撞,或者電源不穩(wěn)定等情況,都可能導(dǎo)致此類故障的發(fā)生。當(dāng)然上面提到的這3個(gè)模塊都有外部接口,比較容易辨認(rèn),有的還可以通過模塊上的指示燈來辨別故障。比如:堆疊模塊上有一個(gè)扁平的梯形端口,或者有的交換機(jī)上是一個(gè)類似于USB的接口。管理模塊上有一個(gè)CONSOLE口,用于和網(wǎng)管計(jì)算機(jī)建立連接,方便管理。如果擴(kuò)展模塊是光纖連接的話,會(huì)有一對(duì)光纖接口。在排除此類故障時(shí),首先確保交換機(jī)及模塊的電源正常供應(yīng),然后檢查各個(gè)模塊是否插在正確的位置上,后檢查連接模塊的線纜是否正常。在連接管理模塊時(shí),還要考慮它是否采用規(guī)定的連接速率,是否有奇偶校驗(yàn),是否有數(shù)據(jù)流控制等因素。連接擴(kuò)展模塊時(shí),需要檢查是否匹配通信模式,比如:使用全雙工模式還是半雙工模式。當(dāng)然如果確認(rèn)模塊有故障,解決的方法只有一個(gè),那就是應(yīng)當(dāng)立即聯(lián)系供應(yīng)商進(jìn)行更換。
排查步驟4:背板故障
工業(yè)交換機(jī)的各個(gè)模塊都是接插在背板上的。如果環(huán)境潮濕,電路板受潮短路,或者元器件因高溫、雷擊等因素而受損都會(huì)造成電路板不能正常工作。比如:散熱性能不好或環(huán)境溫度太高導(dǎo)致機(jī)內(nèi)溫度升高,致使元器件燒壞。在外部電源正常供電的情況下,如果交換機(jī)的各個(gè)內(nèi)部模塊都不能正常工作,那就可能是背板壞了,遇到這種情況即使是電器維修工程師,恐怕也無計(jì)可施,唯 一的辦法就是更換背板了。
排查步驟5:外部因素
由于病毒或者黑客攻擊等情況的存在,有可能某臺(tái)主機(jī)向所連接的端口發(fā)送大量不符合封裝規(guī)則的數(shù)據(jù)包,造成工業(yè)交換機(jī)處理器過分繁忙,致使數(shù)據(jù)包來不及轉(zhuǎn)發(fā),進(jìn)而導(dǎo)致緩沖區(qū)溢出產(chǎn)生丟包現(xiàn)象。還有一種情況就是廣播風(fēng)暴,它不僅會(huì)占用大量的網(wǎng)絡(luò)帶寬,而且還將占用大量的CPU處理時(shí)間。網(wǎng)絡(luò)如果長(zhǎng)時(shí)間被大量廣播數(shù)據(jù)包所占用,正常的點(diǎn)對(duì)通信就無法正常進(jìn)行,網(wǎng)絡(luò)速度就會(huì)變慢或者癱瘓。一塊網(wǎng)卡或者一個(gè)端口發(fā)生故障,都有可能引發(fā)廣播風(fēng)暴。由于工業(yè)交換機(jī)只能分割沖突域,而不能分割廣播域(在沒有劃分VLAN 的情況下),所以當(dāng)廣播包的數(shù)量占到通信總量的30%時(shí),網(wǎng)絡(luò)的傳輸效率就會(huì)明顯下降。
排查步驟6:配置不當(dāng)
初學(xué)者對(duì)工業(yè)交換機(jī)不熟悉,或者由于各種工業(yè)交換機(jī)配置不一樣,管理員往往在配置工業(yè)交換機(jī)時(shí)會(huì)出現(xiàn)配置錯(cuò)誤。比如VLAN 劃分不正確導(dǎo)致網(wǎng)絡(luò)不通,端口被錯(cuò)誤地關(guān)閉,工業(yè)交換機(jī)和網(wǎng)卡的模式配置不匹配等原因。這類故障有時(shí)很難發(fā)現(xiàn),需要一定的經(jīng)驗(yàn)積累。如果不能確保用戶的配置有問題,請(qǐng)先恢復(fù)出廠默認(rèn)配置,然后再一步一步地配置。在配置之前,先閱讀說明書,這也是網(wǎng)管所要養(yǎng)成的習(xí)慣之一。每臺(tái)工業(yè)交換機(jī)都有詳細(xì)的安裝手冊(cè)、用戶手冊(cè),深入到每類模塊都有詳細(xì)的講解。
排查步驟7:系統(tǒng)錯(cuò)誤
工業(yè)交換機(jī)系統(tǒng)是硬件和軟件的結(jié)合體。在工業(yè)交換機(jī)內(nèi)部有一個(gè)可刷新的只讀存儲(chǔ)器,它保存的是這臺(tái)工業(yè)交換機(jī)所必需的軟件系統(tǒng)。這類錯(cuò)誤也和我們常見的Windows、Linux一樣,由于當(dāng)時(shí)設(shè)計(jì)的原因,存在一些漏洞,在條件合適時(shí),會(huì)導(dǎo)致工業(yè)交換機(jī)滿載、丟包、錯(cuò)包等情況的發(fā)生。所以工業(yè)交換機(jī)系統(tǒng)提供了諸如Web、FTP等方式來下載并更新系統(tǒng)。當(dāng)然在升級(jí)系統(tǒng)時(shí),也有可能發(fā)生錯(cuò)誤。對(duì)于此類問題,我們需要養(yǎng)成經(jīng)常瀏覽設(shè)備廠商網(wǎng)站的習(xí)慣,如果有新的系統(tǒng)推出或者新的補(bǔ)丁,請(qǐng)及時(shí)更新。
排查步驟8:線纜故障
其實(shí)這類故障從理論上講,不屬于工業(yè)交換機(jī)本身的故障,但在實(shí)際使用中,電纜故障經(jīng)常導(dǎo)致工業(yè)交換機(jī)系統(tǒng)或端口不能正常工作,所以這里也把這類故障歸入工業(yè)交換機(jī)硬件故障。比如接頭接插不緊,線纜制作時(shí)順序排列錯(cuò)誤或者不規(guī)范,線纜連接時(shí)應(yīng)該用交叉線卻使用了直連線,光纜中的兩根光纖交錯(cuò)連接,錯(cuò)誤的線路連接導(dǎo)致網(wǎng)絡(luò)環(huán)路等。
收起