Teradata CTO寶立明:CIO數(shù)據(jù)分析需勇于創(chuàng)新

2011/05/25

  第11屆Teradata數(shù)據(jù)中心峰會上,eNet硅谷動力對Teradata的首席技術官Stephen Brobst寶立明先生進行了專訪。了解到Teradata在數(shù)據(jù)分析和數(shù)據(jù)處理方面的優(yōu)勢以及CIO在需要數(shù)據(jù)分析與處理時需要注意的問題。
  

  Teradata數(shù)據(jù)分析與處理的優(yōu)勢

  記者:隨著數(shù)據(jù)量的飛速增長,大家面對更多的信息的時候會很迷茫。Teradata如何幫助處理這些海量的信息?

  寶立明:人們對于海量數(shù)據(jù)感到困惑是因為對于整個數(shù)據(jù)的全局沒有很好的把握,他們所看到的只是破碎的、零散的、局部的數(shù)據(jù),就像你通常把一些數(shù)據(jù)做了一個總結一樣,而在這個總結的過程當中,你會丟失掉很多細節(jié),而有很多有價值的信息正隱藏在具體的細節(jié)當中。Teradata能幫助用戶深度了解這些數(shù)據(jù)的細節(jié),打個比方,幫助客戶了解數(shù)據(jù)每一個構成的原子或者是分子。要實現(xiàn)這樣的目標,需要有很強的可伸展性。這種可伸展性可以幫助用戶能夠去掉那些局部性的對于數(shù)據(jù)的了解,深入到數(shù)據(jù)的細節(jié),這樣就可以解開用戶對于整個大數(shù)據(jù)的困惑。

  記者:過去在技術上,要分析非結構性的信息的難處是什么?在買了Aster Data之后,可以解決這樣的問題嗎?

  寶立明:Teradata的數(shù)據(jù)庫主要用是來分析結構性的數(shù)據(jù)。當Teradata收購了第三方的工具之后,我們可以把一些非結構性數(shù)據(jù)轉化成結構型數(shù)據(jù),再用Teradata的解決方案,或者產(chǎn)品進行相應的分析。收購Aster Data之后,其實我們可以直接地把一些非結構性的數(shù)據(jù)存儲到我們這里,然后可以直接對非結構性的數(shù)據(jù)進行相應的分析。

  如果你問我是不是通過Aster Data,就完全解決了分析非結構性數(shù)據(jù)的問題,我的答案是我們永遠不可能完全把某些問題都解決。只不過是現(xiàn)在通過收購Aster Data之后,這項工作變的更加容易一些了。

  Teradata客戶數(shù)據(jù)保護的優(yōu)勢

  記者:前一陣子大家都知道索尼在網(wǎng)上數(shù)據(jù)泄露那個事情,我想知道一下(50:45)在于保護用戶數(shù)據(jù)這方面有沒有一些相應的措施?

  寶立明:我們有一些非常先進的加密技術,實際上所有的設計都是加密的,都是來自數(shù)據(jù)庫加密,所以除此以外我們有完全并行的內(nèi)部的數(shù)據(jù)庫加密能力,也就是說在表格等等都可以。從安全角度來說可以把所有的數(shù)據(jù)進行編加密、保存還有儲存。即使有一些也進入了我們的系統(tǒng),他們也無法了解這個數(shù)據(jù),而且這些數(shù)據(jù)都必須加密這是客戶的選擇,最好的做法就是由客戶來進行加密。

  記者:在處理海量信息的時候,怎么保護用戶的隱私?

  寶立明:關于隱私的保護的問題,我們可以提供某些層次上的用戶隱私的保護,如:通過對一些數(shù)據(jù)進行加密,或者只讓需要知道數(shù)據(jù)的人了解、接觸或者訪問到這些數(shù)據(jù),比如說需要做決策的人,這只是一種層次上的隱私保護。但是更為重要的是,現(xiàn)在人們都非常擔心自己的數(shù)據(jù)或者信息會被別人看到,而Teradata可以通過數(shù)據(jù)挖掘的軟件解決這些問題。通過數(shù)據(jù)挖掘軟件,實際上看到用戶的數(shù)據(jù)或者信息的并不是某個具體的人,而是一個軟件。這個軟件用來處理這些數(shù)據(jù),并且判斷這個數(shù)據(jù)應該被什么樣的人所使用或者用于什么樣的目的。

  就我個人而言也是數(shù)據(jù)的消費者,我一旦收到比較有用的、有意思的廣告,盡管我知道這只是隨著郵件而附帶來的廣告,但是我仍然愿意收到它。所以說作為一個消費者,對于這樣有用的信息數(shù)據(jù),我還是能夠接受的。另外我覺得我作為一個消費者,我也有權利做出一些決定,我要用哪些數(shù)據(jù)和信息,不用哪些類型的數(shù)據(jù)或者信息。因此消費者實際上可以對此有一定的控制能力,同時也可以來決定哪些最符合他的利益的數(shù)據(jù)。

  很多國家的立法者或者政府希望通過建立或者制定一些保護隱私的法律來實現(xiàn)對用戶信息的保護。但是這些立法者,對于數(shù)據(jù)相應的分析是非常的不了解。最后導致的結果可能就是這種出于隱私保護目的的法律,最終產(chǎn)生不理想的結果。舉個例子,在某些國家對于一些電話用戶的呼叫記錄,最多只能保持90天,而且這樣的一種呼叫記錄只能夠用于計費的目的。這樣就限制了電信運營公司對數(shù)據(jù)的保存,不能夠很好地來設計符合消費者或者用戶需求的電信產(chǎn)品;同時在定價方面也受到了很大的限制,進而影響了市場的競爭。

  所以這個例子說明,雖然立法者的初衷是想要保護用戶的隱私,但是由于他缺乏對數(shù)據(jù)分析的了解,最終可能限制了用戶真正對信息和數(shù)據(jù)的使用。電信運營商如果要保留用戶電話通信的記錄,也有責任對記錄或者信息、數(shù)據(jù)進行保護,以免未經(jīng)授權的人來使用這些信息和數(shù)據(jù)。在這樣一個過程當中,當然就要用到加密的軟件或者是用到其他數(shù)據(jù)保護的方法。我們在全球范圍內(nèi)是和一個叫做Protegrity公司來進行很好的合作,他們有非常出色的加密的能力和技術,所以我們就把他們加密的技術嵌入到了我們Teradata公司的產(chǎn)品和解決方案當中,來為我們的用戶提供相應的保護。

  記者:最近日本發(fā)生的地震以及一些云供應商的宕機情況讓我們對企業(yè)數(shù)據(jù)的災難恢復得到了更大程度上的重視,Teradata是如何進行數(shù)據(jù)災難恢復的。

  寶立明:每一個分支機構當中都會有一定的數(shù)據(jù)的存在,關鍵之處就是在創(chuàng)建這些數(shù)據(jù)的伊始,你就必須要對這些數(shù)據(jù)實現(xiàn)集中化,這樣做的好處就是這些數(shù)據(jù)不再是像孤島式的一個一個存在,而是被集中在一起,這樣你就有一個單一的數(shù)據(jù)來源。你可以通過使用數(shù)據(jù)集成的技術,或者是使用Teradata公司所提供的這些技術和解決方案,深入到每一個數(shù)據(jù)的細節(jié)進行了解。所以實現(xiàn)這樣一個數(shù)據(jù)的集中化之后,隨之而來的就是它可能也會出現(xiàn)這種單點的故障,這時候出現(xiàn)了單點的故障,就必須具備災難恢復的能力。我們經(jīng)常采用的是多系統(tǒng)管理的能力,而且也能夠提供一些多個負載的能力。如果說一旦某一個系統(tǒng),由于自然的災害出現(xiàn)了故障,比如說由于地震、颶風出現(xiàn)了中斷,它就會自動地來轉到其他的系統(tǒng)進行相應的一些數(shù)據(jù)處理和分析的能力。

  有很多執(zhí)行這些關鍵任務的機構,或者是公司,都在采用這種方式來對自己的數(shù)據(jù)進行管理。比如說像沃爾瑪、e-bay、AT&T和世界銀行。另外中國現(xiàn)在也有很多客戶在完成或者執(zhí)行一些關鍵任務的時候,他們也會采用這樣的方式來做。

  另外我還想強調(diào)一下,我們的災難恢復的系統(tǒng)實際上是一個雙有源系統(tǒng),或者是一個雙活躍的系統(tǒng)。Teradata產(chǎn)品跟其他的產(chǎn)品不一樣,其他人員在做災難恢復的時候,通常會有兩套系統(tǒng),一套只是備用的,也就是說只有出現(xiàn)了災難的時候,才會啟動這樣的系統(tǒng)來做。但是我們的不同之處在于我們有兩套系統(tǒng),這兩套系統(tǒng)都是在有源狀態(tài)下進行工作的,也就是都處于活躍的狀態(tài),我們會在這兩套系統(tǒng)之間,實現(xiàn)非常好的負載均衡。這兩套系統(tǒng),都在行之有效地工作,因此也帶來了非常高的成本的效率。而其他的公司的產(chǎn)品只有一套系統(tǒng)一直在動,而另外一套系統(tǒng)一直處在無源的狀態(tài)之下,或者說一直不去積極地在工作,這時候相應的成本也是非常高的。

  CIO進行數(shù)據(jù)分析需勇于創(chuàng)新

  記者:商業(yè)智能現(xiàn)在正在演變成一種商業(yè)分析的趨勢,傳統(tǒng)的數(shù)據(jù)分析方法已經(jīng)不太適合新的發(fā)展。對于這種新的發(fā)展趨勢,Teradata怎么來迎合這種新的趨勢跟態(tài)度的?

  寶立明:如果談到商業(yè)智能分析,能夠給人們帶來什么樣更多的價值,它最主要的一個價值就在于它能夠讓這些知識型的工作人員,更好地對數(shù)據(jù)進行控制。就像剛才我們所提到的,我們提供了一種非常凝結的、云的環(huán)境,讓這些知識性的工作人員,能夠很好地來控制自己的數(shù)據(jù),也能夠控制對于數(shù)據(jù)的分析。比如說像Teradata公司所提供的數(shù)據(jù)視覺化技術,就可以使得知識型的工作人員,不需要有IT人員的介入,就可以把自己相應的一些數(shù)據(jù)進行分析和處理。

  記者:在大數(shù)據(jù)時代,您也提到有很多技術在產(chǎn)生,您覺得這些技術對于數(shù)據(jù)倉庫原有的一些技術只是功能上的擴展還是說意味著數(shù)據(jù)倉庫和商業(yè)智能原有的技術正在過時。

  寶立明:我覺得新技術或者說具有突破性意義的技術是非常必要的。所以這也就是我們?yōu)槭裁词召廇ster Data這家公司,因為它所提供的就是具有突破性意義的新的技術。我們認為在一段時間內(nèi),新舊技術之間是有一個共存的關系,但是最終新的技術還是會合并成為一體,新技術要花一定的時間要不斷演進,最終慢慢地來形成對舊技術的包圍,以及最后把它融為一體。

  記者:您作為數(shù)據(jù)分析與處理這方面的技術專家,能不能為我們展望一下您現(xiàn)在正在思考的沒有成型的未來的技術趨勢?
  寶立明:我有四點跟你介紹一下,首先第一點,就是剛才在新聞發(fā)布會的現(xiàn)場也提到的一點,我們會看到傳感器將會是無處不在的,物聯(lián)網(wǎng)的不斷發(fā)展,也給我們帶來了海量的數(shù)據(jù),讓我們進行分析。

  第二點,我們要實現(xiàn)規(guī)模化,很多分析性的規(guī)模要進入數(shù)據(jù)庫當中。我們不能只是做數(shù)據(jù)的拷貝,而更多地要把分析性的功能納入到數(shù)據(jù)庫當中,比如說像現(xiàn)在SAS和Teradata之間的一個合作,我們可以把SAS公司的數(shù)據(jù)挖掘的能力納入到我們數(shù)據(jù)庫當中,另外還有Informix與我們的合作,我們要把它的數(shù)據(jù)集成功能納入到數(shù)據(jù)庫當中。

  第三點,無處不在的或者普遍存在的商業(yè)智能。商業(yè)智能在將來會發(fā)展成為消費者智能,所以“智能”以及“分析”這兩個詞應該說是未來非常關鍵的兩個要素。而且隨著移動終端不斷地普及,我們看到越來越多的智能和分析的能力,會被終端用戶通過移動的終端來實現(xiàn)。所以移動終端對于未來也是非常重要的。

  第四點,這些非傳統(tǒng)性的數(shù)據(jù)分析,比如說像社交媒體,像視頻或者像一些話音方面的數(shù)據(jù),從傳統(tǒng)意義上來說,我們是不需要對這些數(shù)據(jù)進行分析的,但是這些數(shù)據(jù)也成為一個需要分析的數(shù)據(jù)。

  記者:現(xiàn)在數(shù)據(jù)社會化的趨勢,讓數(shù)據(jù)分析獲取比較困難。您認為CIO應該如何應對這些數(shù)據(jù)的獲得與分析?

  寶立明:數(shù)據(jù)社會化需要捕捉一些社交媒體所產(chǎn)生的用戶感覺,這個時候我們就必須對這些社交媒體整個的網(wǎng)絡有一個非常清楚的了解和認知,才可以從這個社交媒體網(wǎng)絡上提取相應的數(shù)據(jù)和信息來近些分析,以此來得出對用戶的感覺、了解和捕捉。這時候所做的分析就包括,對社交媒體上的用戶的一些自然語言的處理,以及對他們的行為或者是一些相應的活動的分析和處理,這也就是我們收購了Aster Data公司的原因。這個公司的技術可以幫助我們處理非結構性的數(shù)據(jù),對它們進行很好的分析。因此我對于CIO們的建議就是,應該考慮做一些相應的投資,也就是說不要再僅僅局限于對傳統(tǒng)性的數(shù)據(jù)來進行一些分析和處理,而現(xiàn)在需要來投入一些力量,來對非結構性的數(shù)據(jù)進行很好的分析。所以他們在相應的策略和考慮的時候,要進行重新的思索和定位。

eNet硅谷動力



相關閱讀:
Radware:IDC云化漸熱 應用交付虛擬化正逢時 2011-05-23
數(shù)據(jù)中心虛擬化不斷深入 網(wǎng)絡則“方向未明” 2011-05-23
構建電信運營網(wǎng)絡數(shù)據(jù)中心 應對數(shù)據(jù)難題 2011-05-17
數(shù)據(jù)中心效率(PUE)計算指南 2011-05-17
中國將是云計算未來發(fā)展的中心 2011-04-29

熱點專題:  數(shù)據(jù)中心
分類信息:  數(shù)據(jù)中心_與_企業(yè)