隨著數(shù)據(jù)中心建設(shè)的規(guī)模越來(lái)越大,新技術(shù)越來(lái)越多,承載數(shù)據(jù)中心業(yè)務(wù)的網(wǎng)絡(luò)變得異常復(fù)雜。為了適應(yīng)數(shù)據(jù)中心業(yè)務(wù)的發(fā)展,數(shù)據(jù)中心網(wǎng)絡(luò)也在不斷更新與變化,這給日后的運(yùn)維帶來(lái)了極大難度。談到數(shù)據(jù)中心網(wǎng)絡(luò)運(yùn)維,其實(shí)是老生常談的問(wèn)題,也是數(shù)據(jù)中心里問(wèn)題最為突出的部分,這主要源于網(wǎng)絡(luò)技術(shù)的封閉性和排它型,當(dāng)然網(wǎng)絡(luò)協(xié)議和設(shè)備設(shè)計(jì)的復(fù)雜性也有一定關(guān)系,這導(dǎo)致掌握網(wǎng)絡(luò)運(yùn)維要領(lǐng)要比掌握其它技術(shù)難度要大得多,所以在網(wǎng)絡(luò)運(yùn)維過(guò)程中才出現(xiàn)了各種各樣的問(wèn)題,而且網(wǎng)絡(luò)設(shè)備一旦出現(xiàn)問(wèn)題,尤其是核心網(wǎng)絡(luò)問(wèn)題,影響的將是整個(gè)數(shù)據(jù)中心的業(yè)務(wù),有時(shí)又沒有網(wǎng)絡(luò)備份可用,在這樣危機(jī)的情況下更考驗(yàn)運(yùn)維人員的綜合處理問(wèn)題能力,各種因素影響下導(dǎo)致了網(wǎng)絡(luò)運(yùn)維上出現(xiàn)了多種難題,本文就來(lái)說(shuō)一說(shuō)這些難題,看大家在數(shù)據(jù)中心運(yùn)維工作中是否有同感,是否有更好的應(yīng)對(duì)之策。
難題一:太多手工操作期盼減少
數(shù)據(jù)中心網(wǎng)絡(luò)運(yùn)維人員最怕的就是做網(wǎng)絡(luò)變更,因?yàn)樯婕疤嗟拿畈僮,而弄不好就容易出錯(cuò)。如果網(wǎng)絡(luò)運(yùn)維可以有自動(dòng)部署的方式,那可以大大減少運(yùn)維人員的工作時(shí)間,也不容易出錯(cuò),作為數(shù)據(jù)中心網(wǎng)絡(luò)運(yùn)維人員沒有必要對(duì)這些網(wǎng)絡(luò)底層命令有過(guò)多了解,只要通過(guò)網(wǎng)絡(luò)變更滿足業(yè)務(wù)需求即可。實(shí)際上,這類難題在運(yùn)維工作中是最為突出的,很多網(wǎng)絡(luò)設(shè)備命令晦澀,讓人難以理解,運(yùn)維的人根本沒有時(shí)間和能力去走讀每篇RFC文檔,需要的是簡(jiǎn)單明了的解決方案,SDN的出現(xiàn)或許可以減輕運(yùn)維人員對(duì)手工操作的依賴,但未來(lái)能夠發(fā)展到何種程度,還是未知數(shù)。
難題二:網(wǎng)絡(luò)變更很困難跟不上需求
數(shù)據(jù)中心業(yè)務(wù)部門的需求是多種多樣的,尤其是為了業(yè)績(jī),很多不合理的需求也接納,到了實(shí)施的時(shí)候才發(fā)現(xiàn)困難重重。很多業(yè)務(wù)部門對(duì)數(shù)據(jù)中心網(wǎng)絡(luò)并沒有清晰的了解,也不知道現(xiàn)有的網(wǎng)絡(luò)能夠提供什么,這就導(dǎo)致兩面的脫節(jié),最終導(dǎo)致很多需求根本無(wú)法通過(guò)網(wǎng)絡(luò)變更來(lái)實(shí)現(xiàn),或者是網(wǎng)絡(luò)變更會(huì)影響現(xiàn)有業(yè)務(wù),付出很大的代價(jià)。
難題三:網(wǎng)絡(luò)操作需跟系統(tǒng)集成商協(xié)作問(wèn)題
網(wǎng)絡(luò)只是數(shù)據(jù)中心最為重要的一部分,任何業(yè)務(wù)的運(yùn)行都離不開網(wǎng)絡(luò)部分,所以網(wǎng)絡(luò)的任何操作都需要與其它系統(tǒng)模塊溝通好,避免造成整個(gè)系統(tǒng)運(yùn)行受到影響。這里就涉及到和系統(tǒng)集成商打交道。
難題四:忙于維護(hù) 難快速部署新業(yè)務(wù)
如果一個(gè)數(shù)據(jù)中心網(wǎng)絡(luò)本身設(shè)計(jì)就有先天缺陷,那頻繁出問(wèn)題是必然的。這樣的數(shù)據(jù)中心網(wǎng)絡(luò)運(yùn)維人員也是每天都忙于處理各種各樣的網(wǎng)絡(luò)問(wèn)題,尤其是已經(jīng)影響到業(yè)務(wù)運(yùn)行的問(wèn)題,這樣根本沒有精力部署新業(yè)務(wù)。這樣的惡性循環(huán)導(dǎo)致整個(gè)數(shù)據(jù)中心的業(yè)務(wù)都無(wú)法推進(jìn),最終流失大量客戶。
難題五:部署網(wǎng)絡(luò)麻煩
數(shù)據(jù)中心里的設(shè)備要實(shí)現(xiàn)互聯(lián)互通,都要有自己的IP地址或MAC地址,用這些來(lái)代表自己在網(wǎng)絡(luò)里的身份。運(yùn)維人員要對(duì)這些身份在網(wǎng)絡(luò)中進(jìn)行適配,比如下發(fā)動(dòng)態(tài)路由學(xué)習(xí)或者靜態(tài)路由,需要配置網(wǎng)關(guān)、DHCP等,這些配置甚至要在全網(wǎng)的所有網(wǎng)絡(luò)設(shè)備上部署。有的數(shù)據(jù)中心從核心到接入,多達(dá)數(shù)百臺(tái)網(wǎng)絡(luò)設(shè)備,一臺(tái)一臺(tái)配置顯然是非常麻煩的,如何減輕這方面的工作量,對(duì)于提升運(yùn)維工作效率特別有意義。
難題六:簡(jiǎn)單工具手動(dòng)管理IP地址
網(wǎng)絡(luò)運(yùn)維人員平時(shí)要對(duì)這些設(shè)備的IP地址進(jìn)行管理,以便在使用時(shí)或者故障時(shí)能夠找到自己想要的那臺(tái),這個(gè)數(shù)量是海量的。一個(gè)大型數(shù)據(jù)中心服務(wù)器上萬(wàn)臺(tái)是很平常的,這樣整理這些設(shè)備的IP地址就需要很長(zhǎng)的時(shí)間。運(yùn)維人員只能通過(guò)簡(jiǎn)單的Excel表格來(lái)管理,用的時(shí)候進(jìn)行查找,有更新時(shí)進(jìn)行記錄,這個(gè)數(shù)據(jù)必須要實(shí)時(shí)更新才能準(zhǔn)確,這需要運(yùn)維人員投入大量的精力來(lái)維護(hù)這個(gè)表單,工作繁瑣。
難題七:網(wǎng)絡(luò)設(shè)備類型多,全掌握難度大
最令運(yùn)維人員頭痛的是網(wǎng)絡(luò)設(shè)備類型繁多,不同廠家的設(shè)備命令風(fēng)格和含義均不同,就算是一個(gè)廠商的不同型號(hào)設(shè)備也會(huì)不同。這給網(wǎng)絡(luò)運(yùn)維帶來(lái)了極大難度,運(yùn)維人員不得不掌握數(shù)據(jù)中心里所有設(shè)備的基本操作命令,要花大量的時(shí)間去熟悉這些設(shè)備,一般的網(wǎng)絡(luò)設(shè)備命令都有數(shù)千條,要全掌握基本不可能,再加上是不同型號(hào)的設(shè)備,運(yùn)維人員會(huì)瘋掉。
難題八:網(wǎng)管團(tuán)隊(duì)技術(shù)水平不高
目前數(shù)據(jù)中心的網(wǎng)管主要是對(duì)運(yùn)行的網(wǎng)絡(luò)設(shè)備進(jìn)行監(jiān)控,但實(shí)際上主要就是將設(shè)備上的日志告警提取出來(lái),然后給出一些告警提示,還有就是通過(guò)網(wǎng)管可以獲取一些設(shè)備信息。實(shí)際上,網(wǎng)管對(duì)運(yùn)維工作支持不是很大。真正的智能網(wǎng)管應(yīng)該代替運(yùn)維人員的部分工作,比如下發(fā)配置變更、業(yè)務(wù)故障自動(dòng)切換網(wǎng)絡(luò)、網(wǎng)絡(luò)自檢等等,通過(guò)網(wǎng)管實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)真正的智能化管理,減少運(yùn)維人員的工作量,要實(shí)現(xiàn)這些還需要網(wǎng)管技術(shù)進(jìn)一步提升。
難題九:要掌握的工具太多
以太網(wǎng)RFC協(xié)議有8000多篇,根據(jù)網(wǎng)絡(luò)的五大層有多種多樣的協(xié)議定義。正是網(wǎng)絡(luò)協(xié)議的多樣性,所以要設(shè)計(jì)很多的輔助工具去掌握它,在進(jìn)行網(wǎng)絡(luò)分析時(shí)也要借助很多的工具。比如XPING、Tracert、抓包工具、IP掩碼換算等等,這些工具很多,很多還是網(wǎng)絡(luò)上開源的小工具,有各種各樣的BUG,使用起來(lái)也不方便,但是在網(wǎng)絡(luò)運(yùn)維時(shí)又不得不用,有時(shí)實(shí)在用不了就自己開發(fā)個(gè)小工具,正是因?yàn)檫@樣,所以網(wǎng)絡(luò)上才出現(xiàn)了那么多的網(wǎng)絡(luò)分析小工具。
難題十:運(yùn)維工作苦、收入低
網(wǎng)絡(luò)運(yùn)維是功能,性價(jià)比不高,作為數(shù)據(jù)中心里重要的一部分,網(wǎng)絡(luò)的重要性并沒有體現(xiàn)到網(wǎng)絡(luò)運(yùn)維的收入上,這就導(dǎo)致沒有人愿意在運(yùn)維工作上深入鉆研,做運(yùn)維的人員大多是工作1~3年的初級(jí)技術(shù)人員,缺少一些10年以上資深的網(wǎng)絡(luò)專家,這導(dǎo)致數(shù)據(jù)中心的運(yùn)維水平無(wú)法提升。
顯而易見,數(shù)據(jù)中心網(wǎng)絡(luò)運(yùn)維面臨不少難題,是數(shù)據(jù)中心里的短板。哪個(gè)數(shù)據(jù)中心能解決好網(wǎng)絡(luò)運(yùn)維的問(wèn)題,也就能在這個(gè)圈內(nèi)混得好。