建構高可靠度(High Availability, HA)的CompactPCI系統(tǒng)
Jeff Munch 2003/04/04
高可靠度(High Availability, HA)是現今市場中被過度使用的詞匯,廠商沿用此詞匯可定義從最簡單的備援電源(power supply)一直到復雜度高的全復聯系統(tǒng)(redundant system),然而這卻產生了「'什么是高可靠度?」的問題,把高可靠度想成是系統(tǒng)使用率的提高或是當機時間的減少,可能比較簡單,F今許多電訊系統(tǒng)要求5個9(5 NINES)的可靠度、亦或一般通稱的99.999%運作時間,每年可允許這些系統(tǒng)的總當機時間是5.26分鐘(525,600分鐘/年 x 99.999%), 5分鐘的當機尚包括既定的系統(tǒng)維護及任何因系統(tǒng)之部分故障所造成的當機時間。設計一個符合5個9(5 NINES)使用率的高可靠度系統(tǒng)通常會需要系統(tǒng)的每項功能都有備援設計,也就是不允許單點的故障。在邁向高可靠度系統(tǒng)之路一般包括備援電源、備援風扇架與備援硬盤槽,這些備援零組件的加入將可以降低零組件故障而導致系統(tǒng)當機的或然率,因此,添加備援零組件增加了系統(tǒng)的可靠度。如各位所看到的,備援電源、風扇與硬盤是增加可靠度最直接的方式,然在系統(tǒng)中添加備援運算組件則是一件相當復雜的挑戰(zhàn)。將CompactPCI應用于高可靠度的系統(tǒng)應用上
多年來系統(tǒng)開發(fā)者已將PICMG 2.0 CompactPCI 規(guī)格應用于各種可與高可靠度應用兼容的系統(tǒng)上,隨著市場上對高可靠度的要求提高,CompactPCI系統(tǒng)便隨之改進以因應新的挑戰(zhàn),而不再是原本簡單的總線架構。圖1顯示第一代典型的CompactPCI 架構。
PICMG 2.0 CompactPCI系統(tǒng)是由一組或多組CompactPCI 總線所組成,每個總線最多可達8個CompactPCI板卡插槽,其中包含一個系統(tǒng)插槽(system slot)與最多達7個外圍插槽(peripheral slot)。PCI總線是作為該總線內插槽之間的主要通訊途徑,在這個架構下,PCI總線與系統(tǒng)插槽是一個可能的故障單點,故障的周邊插槽會讓整個PCI總線停止作用而阻礙了其它任一插槽之間的通訊。這種故障單點成為CompactPCI采用高可靠度應用的一個主要障礙,早期的CompactPCI 高可靠度系統(tǒng)架構必須克服PCI總線單點故障的限制,典型的解決方法則是添加第二個CompactPCI 總線且讓此二個總線的功能相同。圖2顯示雙CompactPCI 總線架構的范例。
在圖2中,雙總線與雙系統(tǒng)插槽是現行標準CompactPCI架構中被用以提供單點故障備援的解決方案。在雙總線架構(Dual Segment)中,每個系統(tǒng)插槽都可控制PCI總線1與PCI總線2,透過備援系統(tǒng)插槽的提供,就可允許其中一個系統(tǒng)插槽的故障;同樣的道理亦可應用在PCI總線的故障上,若故障發(fā)生于PCI總線1,則PCI總線2可以繼續(xù)處理作業(yè)。這種架構的工程挑戰(zhàn)是很復雜的,系統(tǒng)插槽提供服務總線的時序(clock)、仲裁(arbitration)與阻斷(interrupt),其中一個系統(tǒng)插槽故障時會將該系統(tǒng)插槽的時序驅動器、仲裁及阻斷控制器功能一并轉移到仍可作用中的另一系統(tǒng)插槽,然而,要得知總線的故障時間并在不阻礙整個系統(tǒng)的使用率之下,將系統(tǒng)工作移轉至另一備援系統(tǒng)是相當困難的。在1999年,PICMG協會組了一個小組委員會,任務是將備援系統(tǒng)插槽的執(zhí)行標準化,然PICMG
2.13備援系統(tǒng)插槽規(guī)格卻在三年后被廢棄不用,PICMG 2.13是唯一未完成規(guī)格就被解散的小組委員會,其主要是因為問題的復雜性與相對應的解決方案因素。毫無疑問地,CompactPCI中的備援系統(tǒng)插槽可以用來增加系統(tǒng)的可靠度,但卻受限于高昂的成本與高度復雜性而阻礙其發(fā)展,此外,提供這種架構的廠商其所銷售的產品皆屬專屬性方案(proprietary
solutions),而非基于開放架構(open architecture)的產品。
在CompactPCI 加入IP數據的傳輸
在2001年9月,PICMG協會核準PICMG 2.16 封包交換背板(Packet Switched Backplane)規(guī)格,本規(guī)格對于在一個CompactPCI架構里外圍插槽(peripheral slots)與光纖插槽(fabric slots)之間10/100/1000Mbit Ethernet的互聯做了詳細定義。光纖插槽是相互備援的,PICMG2.16兼容系統(tǒng)已被廣泛應用于多種用途上,Ethernet互聯與IP數據傳輸需求的普遍特性促使系統(tǒng)提供者廣泛采用此規(guī)格。圖3顯示典型的PICMG2.0與2.16架構。
在 PICMG 2.16 兼容系統(tǒng)中,IP數據傳輸可以作為系統(tǒng)內的主要通訊頻道,這種通訊途徑皆有備援聯機到備援光纖插槽,PICMG 2.16規(guī)格可避免系統(tǒng)工作一起使用CompactPCI
總線,并在不增加系統(tǒng)成本的情況下增加系統(tǒng)可靠度。PICMG2.16兼容系統(tǒng)是自動備援的,不會產生單點故障。Ethernet光纖(Ethernet
fabric)是下一代電信應用里處理封包數據傳輸的一種便利方法。
高可靠度CompactPCI 系統(tǒng)的下一步發(fā)展將是去除系統(tǒng)插槽(system slot);因為應用程序利用現今系統(tǒng)的IP互聯,PCI總線逐漸成為派不上用場的費用。PICMG協會現正進行CompactTCA的規(guī)格制訂,CompactTCA規(guī)格可望結合AdvancedTCA(PICMG
3.0)所定義的系統(tǒng)管理能力、PICMG 2.0所定義的標準機箱(Form Factor)及PICMG 2.16所定義的數據傳輸。這種架構將不包含PCI總線,在此架構下的系統(tǒng)將能夠支持24個外圍插槽與2個光纖插槽。摒除PCI總線將可降低CompactPCI
系統(tǒng)所使用的電路板成本、降低提供備援系統(tǒng)插槽(system slot)的復雜性,以及增加插槽總數。圖4顯示可能的CompactTCA系統(tǒng)范例。
總結
PICMG 2.16封包交換背板(Packet Switched Backplane)規(guī)格是改善現今系統(tǒng)可靠度的可行方案之一法,排除第一代CompactPCI系統(tǒng)的單點故障與增加數據傳輸的備援,以提供5個9
(5 NINES,也就是99.999%)可靠度所需的基礎。系統(tǒng)設計師需注意到很多廠商提供的產品是專屬性(proprietary)的外圍備援系統(tǒng)架構,這些封閉式的架構系統(tǒng)無法受益于目前的CompactPCI
開放式經濟效益,可以確定的是使用PICMG 2.16 封包交換背板(Packet Switched Backplane)規(guī)格的CompactPCI
系統(tǒng)不但可提供5個9(5 NINES)可靠度要求所需的點對點數據傳輸與備援,更可提供邁向未來技術之路。
凌華科技供稿 CTI論壇編輯
凌華科技發(fā)布PICMG 1.0寬溫計算機NuPRO-730 2009-08-18 |
凌華科技推出6U CompactPCI單板電腦 2009-08-11 |
凌華發(fā)布PICMG 1.3 SHB規(guī)格工業(yè)電腦NuPRO-E320 2009-06-09 |
凌華科技最新ETX嵌入式模塊計算機ETX-AT 2009-04-22 |
凌華科技發(fā)布3U與6U CompactPCI單板計算機 2009-04-20 |