企業(yè)架構(gòu)高級(jí)經(jīng)理Brenden Bryan稱,在政府雇員健康協(xié)會(huì)(GEHA)徹底調(diào)整數(shù)據(jù)中心并部署Fabric網(wǎng)絡(luò)架構(gòu)基礎(chǔ)設(shè)施后,程序變得“真的是相當(dāng)簡(jiǎn)單”,再也不像許多其它的IT項(xiàng)目那樣復(fù)雜了。“在回顧整個(gè)過(guò)程并且說(shuō)‘我希望做出不同的決定’時(shí),我們沒(méi)有遇到任何問(wèn)題或麻煩。”
位于密蘇里州堪薩斯城的GEHA作為全美第二大的健康計(jì)劃與牙齒健康計(jì)劃正在處理著100多萬(wàn)名聯(lián)邦政府雇員、退休職員和他們的家庭成員的醫(yī)療費(fèi)用報(bào)銷工作。Bryan稱,轉(zhuǎn)向Fabric網(wǎng)絡(luò)架構(gòu)的主要原因是簡(jiǎn)化、鞏固和移除遺留的光纖通道SAN環(huán)境。
Bryan在2010年8月份開始為GEHA工作。他稱,當(dāng)時(shí)他接手的是一個(gè)相當(dāng)?shù)湫偷幕A(chǔ)設(shè)施:由眾多廠商生產(chǎn)并且?guī)в性S多故障的部件拼湊而成。該協(xié)會(huì)還希望虛擬化其大型機(jī)環(huán)境,讓其變成一個(gè)分布式架構(gòu)。Bryan 稱:“我需要的是一個(gè)擁有冗余性和高可獲得性的基礎(chǔ)設(shè)施。”一旦新的基礎(chǔ)設(shè)施就位并穩(wěn)定運(yùn)行,下一步計(jì)劃就是將所有的GEHA Tier 2和Tier 3應(yīng)用轉(zhuǎn)移到這上面,最終將Tier 1報(bào)銷處理系統(tǒng)也轉(zhuǎn)移到這上面。
GEHA部署了由博科生產(chǎn)的以太網(wǎng)交換機(jī)和路由器。目前距這個(gè)為期六個(gè)月的項(xiàng)目結(jié)束日期已經(jīng)過(guò)了一年多時(shí)間。他稱,它們提供了一個(gè)高速環(huán)境和一個(gè)20比1的虛擬機(jī)與刀片服務(wù)器硬件的比例。
Bryan 稱:“我能夠保持最低限度的物理服務(wù)器數(shù)量,盡可有的利用它們。它們讓我能夠提高存儲(chǔ)效率和計(jì)算效率。”
部署數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)需要一些規(guī)劃。ZK Research 的首席分析師Zeus Kerravala稱,這意味著必須要用新的交換機(jī)設(shè)備升級(jí)和替代老式的交換機(jī),因?yàn)樵诠饫w通道網(wǎng)絡(luò)中使用了不同的流量配置。“你必須要重新搭建你的網(wǎng)絡(luò),以及重新連接服務(wù)器。”
實(shí)現(xiàn)扁平化
數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)是一個(gè)針對(duì)橫向信息流優(yōu)化過(guò)網(wǎng)絡(luò),相對(duì)于傳統(tǒng)網(wǎng)絡(luò)來(lái)說(shuō),其更為扁平,更為簡(jiǎn)單。Kerravala解釋稱,其更多的是針對(duì)客戶端/服務(wù)器設(shè)置進(jìn)行設(shè)計(jì)的,為的是實(shí)現(xiàn)服務(wù)器與網(wǎng)絡(luò)核心實(shí)現(xiàn)信息往來(lái)。
Fabric網(wǎng)絡(luò)模式中,流量在網(wǎng)絡(luò)和虛擬機(jī)之間橫向流通。“因此其更多的是一種服務(wù)器對(duì)服務(wù)器的連接。”fabric網(wǎng)絡(luò)更為扁平,并且不超過(guò)兩層。相比之下,遺留的網(wǎng)絡(luò)至少擁有三層或甚至更多的層。Kerravala稱,這些年來(lái),存儲(chǔ)網(wǎng)絡(luò)也采用了這種設(shè)計(jì)方式,如今數(shù)據(jù)網(wǎng)絡(luò)也需要采用這種設(shè)計(jì)方式。
推動(dòng)向fabric網(wǎng)絡(luò)轉(zhuǎn)型的一個(gè)因素是,在財(cái)富2000排行榜上的公司,有半數(shù)的企業(yè)數(shù)據(jù)中心工作負(fù)載被進(jìn)行了虛擬化。當(dāng)實(shí)現(xiàn)了數(shù)據(jù)中心負(fù)載實(shí)現(xiàn)了虛擬化后,他們開始關(guān)注如何讓他們的服務(wù)器與其它的服務(wù)器以及網(wǎng)絡(luò)進(jìn)行通信。
企業(yè)存儲(chǔ)集團(tuán)高級(jí)分析師Bob Laliberte 稱:“我們將這視為數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)方面的發(fā)展。推動(dòng)因素是越來(lái)越多的服務(wù)器對(duì)服務(wù)器連接。這些不同的服務(wù)器需要彼此對(duì)話,與網(wǎng)絡(luò)核心進(jìn)行通信。這些都增加了處理負(fù)載和延時(shí)。”
虛擬化增加了復(fù)雜性,因?yàn)檫@意味著動(dòng)態(tài)移動(dòng)許多東西,“因此網(wǎng)絡(luò)廠商正在努力簡(jiǎn)化這些復(fù)雜環(huán)境。”
當(dāng)數(shù)據(jù)中心無(wú)法擴(kuò)展
隨著房屋止贖事件在2006年達(dá)到頂峰,Walz集團(tuán)發(fā)現(xiàn)他們的數(shù)據(jù)中心無(wú)法擴(kuò)展以有效應(yīng)對(duì)額外的服務(wù)增長(zhǎng)需求。該公司負(fù)責(zé)為多個(gè)行業(yè)提供文檔管理、履約和合規(guī)服務(wù)。公司的首席信息安全官Bart Falzarano稱:“這妨礙了業(yè)務(wù)的增長(zhǎng)。”
Falzarano稱,公司招聘了額外的IT員工以應(yīng)對(duì)這些不同的系統(tǒng)和管理措施,建立新的服務(wù)器,擴(kuò)展網(wǎng)絡(luò),增加災(zāi)難恢復(fù)服務(wù)。“但是管理這些技術(shù)問(wèn)題非常困難,尤其是隨著我們開始嘗試向虛擬環(huán)境轉(zhuǎn)移。”他稱。公司還有許多無(wú)法被虛擬化的應(yīng)用,這些必須要被分別管理。“這些系統(tǒng)、存儲(chǔ)和網(wǎng)絡(luò)都有著不同的切入點(diǎn)。我們已經(jīng)變得無(wú)法實(shí)現(xiàn)預(yù)期的目標(biāo)了。”
為了減少?gòu)?fù)雜性,Walz集團(tuán)在2009年部署了思科的統(tǒng)一數(shù)據(jù)中心平臺(tái),這是一個(gè)統(tǒng)一的數(shù)據(jù)中心Fabric架構(gòu),其將計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)和管理綜合到了一個(gè)平臺(tái)中,以實(shí)現(xiàn)IT自動(dòng)化,讓其成為一個(gè)跨越物理和虛擬環(huán)境的服務(wù)。目前這一平臺(tái)在公司中已經(jīng)與NetApp SAN Storage Flexpod平臺(tái)連接在了一起。
Falzarano回憶稱,此前他們使用的是惠普的技術(shù),當(dāng)數(shù)據(jù)庫(kù)的一個(gè)節(jié)點(diǎn)出現(xiàn)故障,就需要給廠商打電話,最終需要取出四個(gè)CPU中的三個(gè),并且需要花上四個(gè)小時(shí)才能排除故障。直到恢復(fù)正常運(yùn)行,14個(gè)小時(shí)已經(jīng)過(guò)去了。
“現(xiàn)在,對(duì)于同樣的故障,如果我們發(fā)現(xiàn)了出問(wèn)題的刀片服務(wù)器節(jié)點(diǎn),我們?cè)?分鐘內(nèi)就可以斷開這一SQL應(yīng)用并重新連接SQL應(yīng)用。在虛擬管理層也可以這樣做。”他稱。
IT一直在追蹤數(shù)據(jù)中心性能,記錄一些關(guān)鍵的指標(biāo)。Falzarano稱,他們發(fā)現(xiàn)密集度變成了8比1,這意味著更少的纜線復(fù)雜度和更低的纜線需求量。老技術(shù)的虛擬化效率為4比1,新技術(shù)具有更高的效率,達(dá)到了15比1。團(tuán)隊(duì)能夠虛擬化以前他們所無(wú)法虛擬化的應(yīng)用。
其它的優(yōu)勢(shì)還包括機(jī)架減少了50%,系統(tǒng)管理更為集中化——目前一個(gè)IT工程師可以管理50個(gè)系統(tǒng)。。
“在使用老技術(shù)時(shí),我們遇到了大量的硬件故障問(wèn)題。在我們的多數(shù)據(jù)中心中,每隔30天就會(huì)出現(xiàn)一個(gè)故障。現(xiàn)在一年都可能不會(huì)出現(xiàn)一個(gè)故障。”他稱。
容易部署
與Walz集團(tuán)的IT執(zhí)行官一樣,GEHA 的IT團(tuán)隊(duì)領(lǐng)導(dǎo)人認(rèn)為部署fabric網(wǎng)絡(luò)模式不僅能夠滿足業(yè)務(wù)需求,還降低了復(fù)雜性、成本和管理數(shù)據(jù)中心所需要的人員數(shù)量。Bryan稱協(xié)會(huì)還獲得了規(guī)模效益,兩個(gè)人即可管理所有的以太網(wǎng)環(huán)境,這與以往需要熟悉fabric的額外人員截然不同。
“在我們的團(tuán)隊(duì)中,沒(méi)有任何一個(gè)人是光纖通道的專家。讓報(bào)銷程序系統(tǒng)具有冗余性與高可獲得性的唯一辦法是依靠以太網(wǎng)fabric網(wǎng)絡(luò)架構(gòu)技術(shù)。我們的員工熟悉這種技術(shù)。”他稱。
Bryan稱,自從無(wú)需購(gòu)買任何光纖通道交換機(jī),協(xié)會(huì)能夠省下了近50多萬(wàn)美元的資金預(yù)算,由于不需要人員管理光纖通道,協(xié)會(huì)運(yùn)營(yíng)開銷減少了約25萬(wàn)美元。“自從改用fabric網(wǎng)絡(luò)架構(gòu),我們能夠取消成堆的設(shè)備。” Bryan稱。
GEHA使用了一個(gè)本地托管服務(wù)提供商以幫助安裝架構(gòu)中一些更為復(fù)雜的部分。“但是從我們打開設(shè)備包裝箱到整個(gè)環(huán)境運(yùn)行起來(lái),只需要兩天的時(shí)間。過(guò)程非常簡(jiǎn)單。” Bryan稱。
他補(bǔ)充道,新架構(gòu)的性能讓人感到十分震驚。他們做了一個(gè)測(cè)試,通過(guò)網(wǎng)絡(luò)將一個(gè)4G的ISO文件從一個(gè)刀片服務(wù)器拷貝到另一個(gè)刀片服務(wù)器上。在網(wǎng)絡(luò)和存儲(chǔ)都通過(guò)相同的光纖通道網(wǎng)絡(luò)架構(gòu)的情況下,耗時(shí)低于1秒鐘。他稱:“我們沒(méi)有看到遷移,我不認(rèn)為它們被真正拷貝了。”
IT正在使用這一架構(gòu)通過(guò)CommVault的軟件備份他們的環(huán)境。Bryan,協(xié)會(huì)正在關(guān)注網(wǎng)絡(luò)吞吐量能在1小時(shí)內(nèi)達(dá)到1太字節(jié)這一性能。“與以前的架構(gòu)相比,吞吐量提升了8至10倍。”
今天,GEHA所有的產(chǎn)品流量正在fabric網(wǎng)絡(luò)架構(gòu)上。Bryan稱,他對(duì)這一基礎(chǔ)設(shè)施已經(jīng)非常滿意了。他稱,基礎(chǔ)設(shè)施的擴(kuò)展已經(jīng)不再是一個(gè)問(wèn)題,通過(guò)聚合架構(gòu)與速度,已經(jīng)成為了一大重要優(yōu)勢(shì)。GEHA也能夠在單一刀片服務(wù)器上運(yùn)行繁重的虛擬機(jī)工作負(fù)載,他稱。“不用在大量的刀片服務(wù)器上花大量的資金,取而代之的是你無(wú)需犧牲性能就能夠增加這些刀片服務(wù)器的投資回報(bào)率。”Bryan稱。
Laliberte稱,他觀察了數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)的未來(lái),發(fā)現(xiàn)這類架構(gòu)僅僅剛剛起步。如果你考慮的是復(fù)雜性和規(guī)模,并且在你的環(huán)境中擁有數(shù)千臺(tái)服務(wù)器和交換機(jī),那么任何類型的架構(gòu)調(diào)整都耗時(shí)耗力。
僅僅是花時(shí)間對(duì)三層架構(gòu)進(jìn)行改良,就需要花上三個(gè)階段。“這些情況已經(jīng)變成了現(xiàn)實(shí)并得到了宣傳,但是要被大規(guī)模部署還需要幾年時(shí)間。”
案例研究:正在使用中的Fabric網(wǎng)絡(luò)架構(gòu)
Dan Shipley以往巡視數(shù)據(jù)中心時(shí),他所看到的全部是一堆雜亂無(wú)章的線纜和交換機(jī)。它們管理起來(lái)即費(fèi)錢又容易出錯(cuò)。Shipley為一家名為供應(yīng)網(wǎng)絡(luò)公司的架構(gòu)師。該公司總部位于圣路易斯市,是一家總資產(chǎn)達(dá)6億美元的辦公用品批發(fā)商。Shipley稱,公司遇到的所有典型問(wèn)題都與傳統(tǒng)的基礎(chǔ)設(shè)施有關(guān):300臺(tái)服務(wù)器消耗掉了大量的電力,占用了大量的空間,在硬件維護(hù)時(shí)必須要停止運(yùn)行。
“我們主要使用的是惠普的產(chǎn)品。我們從惠普那里訂購(gòu)了這些服務(wù)器。由于這些服務(wù)器的研發(fā)時(shí)代都不盡相同,因此如果一臺(tái)服務(wù)器的主要出現(xiàn)了故障,那么我們的員工就要為此忙上一晚上,這非常痛苦。所以我們說(shuō),‘看啊,我們終于擺脫了這種痛苦。’虛擬化已經(jīng)成為了主流,我們需要從這個(gè)傳統(tǒng)游戲中跳出來(lái)。”
目前,供應(yīng)網(wǎng)絡(luò)在他們的數(shù)據(jù)中心中所創(chuàng)建的東西與傳統(tǒng)方式有著很大的不同。公司沒(méi)有部署以太網(wǎng)和架構(gòu)交換機(jī),而是選擇了Xsigo的I/O Director,其位于服務(wù)器機(jī)架頂層,負(fù)責(zé)定向流量。機(jī)架上的所有服務(wù)器都被插入到一個(gè)盒子里,這個(gè)盒子能夠動(dòng)態(tài)地建立與其它所有數(shù)據(jù)中心資源的連接。與其它的數(shù)據(jù)中心架構(gòu)不同,I/O Director提供了InfiniBand架構(gòu)。InfiniBand為一種基于開源標(biāo)準(zhǔn),用于高速通信的交換式光纖通信鏈路。
Shipley稱:“在你的所有服務(wù)器上,你可以去除所有的線纜、以太網(wǎng)和架構(gòu)交換機(jī),將其與一個(gè)InfiniBand線纜連接,出于冗余考慮你可以連接兩個(gè),這就是我們所做的工作。”這些線纜將被插入I/O Director中。“我希望將所有的這些都連接至一個(gè)外部光纖通道存儲(chǔ),創(chuàng)建一個(gè)虛擬化fabric存儲(chǔ)網(wǎng)絡(luò)。實(shí)際上,這些都通過(guò)InfiniBand架構(gòu)運(yùn)行,而服務(wù)器……我認(rèn)為它們?nèi)匀辉谕ㄟ^(guò)fabric進(jìn)行連接。”
這一配置意味著他們現(xiàn)在僅僅使用兩條線纜,而不是多條線纜,同時(shí)擁有大量的帶寬。
供應(yīng)網(wǎng)絡(luò)公司實(shí)現(xiàn)了徹底的虛擬化,他們的數(shù)據(jù)中心數(shù)量由大約20個(gè)架構(gòu)縮減到了4個(gè)。電力消耗和冷卻能耗也得到了降低。
Shipley稱,InfiniBand已經(jīng)在超級(jí)計(jì)算機(jī)領(lǐng)域被應(yīng)用了十年時(shí)間,其具有低成本和開放性。然而相反的是,其它的廠商都在對(duì)以太網(wǎng)進(jìn)行投資,因?yàn)樗麄儾幌M吹絀nfiniBand勝出。目前I/O Director傳輸速度為每秒56G,而最快的以太網(wǎng)連接也不過(guò)每秒10G。
在成本方面,Shipley稱一個(gè)端口的10G以太網(wǎng)網(wǎng)卡的價(jià)格約為600美元,同時(shí)在另一端還需要一個(gè)以太網(wǎng)交換機(jī)端口,其成本為每個(gè)端口大約為1000美元。“因此對(duì)于每一個(gè)以太網(wǎng)連接來(lái)說(shuō),你需要1600美元。”一個(gè)40G單個(gè)端口InfiniBand適配器價(jià)格大約為450至500美元。他稱,36端口的InfiniBand交換機(jī)為6000美元,平均下來(lái)每個(gè)端口的價(jià)格為167美元。
Shipley稱,公司已經(jīng)取消了所有的核心以太網(wǎng)交換機(jī),以支持InfiniBand技術(shù)。
他承認(rèn):“我首先擔(dān)心的是……怕我自己不了解InfiniBand。”當(dāng)時(shí)大多數(shù)企業(yè)架構(gòu)為fabric和以太網(wǎng)。他稱:“我們帶來(lái)了I/O Director,并且與思科的統(tǒng)一數(shù)據(jù)中心進(jìn)行了對(duì)比。前者不僅成本低,速度快,而且簡(jiǎn)單易用。同時(shí)Xsigo的支持也非常的不錯(cuò)。”
Shipley稱,此前的大型數(shù)據(jù)中心工作需要花上12個(gè)小時(shí)。自從部署了I/O Director,同樣的工作所需要時(shí)間不超過(guò)3個(gè)小時(shí)。現(xiàn)在將虛擬機(jī)從一個(gè)托管主機(jī)遷移至另一個(gè)上只需要幾秒鐘時(shí)間,而以往要花上數(shù)分鐘才行。
他稱,他最初擔(dān)憂的是,由于Xsigo是一家規(guī)模較小的廠商,擔(dān)心它們用不了多長(zhǎng)時(shí)間就會(huì)倒閉。但是,他們發(fā)現(xiàn)連VMware都是Xsigo的客戶。
企業(yè)戰(zhàn)略集團(tuán)高級(jí)分析師Bob Laliberte 稱:“Xsigo宣稱,你還可以使用他們的產(chǎn)品替代使用以太網(wǎng)和fabric,并創(chuàng)建一個(gè)fabric網(wǎng)絡(luò)架構(gòu)。他們的說(shuō)法是對(duì)的。當(dāng)你談?wù)摂?shù)據(jù)中心網(wǎng)絡(luò)和數(shù)據(jù)中心架構(gòu)時(shí),Xsigo正在幫助創(chuàng)建一個(gè)兩層的架構(gòu)。不過(guò),瞻博、思科和博科正在嘗試創(chuàng)建更為扁平的網(wǎng)絡(luò)架構(gòu)。”
Laliberte 稱,InfiniBand是一個(gè)優(yōu)秀的協(xié)議,但是這一協(xié)議未必會(huì)被大規(guī)模使用。“它們目前主要還是應(yīng)用在需要進(jìn)行極快計(jì)算的超級(jí)計(jì)算領(lǐng)域。”