Teradata天睿公司大中華區(qū)CEO辛兒倫
雖然已是第三次參加全球用戶大會,談起這屆大會,Teradata天睿公司大中華區(qū)首席執(zhí)行官辛兒倫顯得有些興奮:三年前和團(tuán)隊(duì)一起憧憬向全球推廣大中華區(qū)用戶建設(shè)經(jīng)驗(yàn)的規(guī)劃在此刻實(shí)現(xiàn);中國工商銀行不僅獲得了數(shù)據(jù)倉庫最佳實(shí)施用戶大獎(EPIC)的“運(yùn)營杰出獎”,還受邀在大會上做主題發(fā)言;而中國建設(shè)銀行也獲得EPIC的兩項(xiàng)提名獎。
隨著社會和電腦技術(shù)的不斷發(fā)展,各行各業(yè)所產(chǎn)生的數(shù)據(jù)量不僅越來越大,結(jié)構(gòu)也更豐富,其中的關(guān)系程度也越來越復(fù)雜,而企業(yè)對數(shù)據(jù)分析的需求也越來越高,希望分析探索數(shù)據(jù)背后的價(jià)值。
辛兒倫認(rèn)為,行業(yè)大數(shù)據(jù)從分析領(lǐng)域來看存在一定共性,要求具備三種能力去建設(shè)數(shù)據(jù)分析:即要有整合企業(yè)數(shù)據(jù)的能力;整合數(shù)據(jù)以后,構(gòu)建挖掘、探索潛在商業(yè)價(jià)值的能力;以及制定精確的行動綱領(lǐng),采取高效行動的能力。所以,建立整合、探索和行動這三種能力是非常重要的。
至于大數(shù)據(jù)分析與傳統(tǒng)的商業(yè)智能有哪些不同?辛兒倫解釋稱,傳統(tǒng)商業(yè)智能只是針對結(jié)構(gòu)化數(shù)據(jù)分析的范疇。“過去這幾年來,隨著IT的創(chuàng)新,它的能力已經(jīng)不只是處理結(jié)構(gòu)化的數(shù)據(jù),因?yàn)樵S多網(wǎng)站、日志、文本、社交媒體、機(jī)器新生成的數(shù)據(jù)也需要并值得去分析。這些數(shù)據(jù)都不是以結(jié)構(gòu)化的結(jié)構(gòu)存儲的,以前可能沒有這方面的工具去分析這類數(shù)據(jù)。”
如今,大數(shù)據(jù)分析已經(jīng)逐漸成為行業(yè)熱點(diǎn)。市場研究公司Gartner曾預(yù)計(jì),大數(shù)據(jù)今年將直接或間接拉動全球960億美元的IT支出,這一數(shù)據(jù)在2013年將達(dá)到1200億美元,2016年達(dá)到2320億美元,2015年全球?qū)略?40萬個(gè)IT工作崗位以支持大數(shù)據(jù)。
即便如此,辛兒倫認(rèn)為,大數(shù)據(jù)距離真正爆發(fā)期還有一段距離,在未來五年內(nèi),會加快發(fā)展的速度,但還將處于發(fā)展的階段。“現(xiàn)在根本都還沒有到爆發(fā)期,還是一個(gè)發(fā)展期階段。我覺得至少在未來幾年,隨著更多在分析領(lǐng)域底層基礎(chǔ)技術(shù)的發(fā)展,開發(fā)更多良好的易于使用的工具,會加快發(fā)展的速度。”
以下為部分對話實(shí)錄:
問:今年大會哪些地方給您印象比較深刻?
答:我是第三次參加這個(gè)大會,我和我的團(tuán)隊(duì)在三年前就一起憧憬,能夠在全球的用戶大會上分享我們大中華區(qū)的經(jīng)驗(yàn)。我們大中華區(qū)里有許多客戶,我們和客戶一起投入了很多時(shí)間、很多精力建設(shè)很好、很優(yōu)秀的數(shù)據(jù)倉庫,希望我們有更多的故事能夠與全世界分享。正好Teradata全球用戶大會是一個(gè)很好的平臺,像中國工商銀行經(jīng)過幾年的醞釀和建設(shè),這次非常榮幸邀請到他們做大會主題發(fā)言,還獲得了EPIC的“運(yùn)營杰出獎”。中國建設(shè)銀行通過8-9年的數(shù)據(jù)倉庫建設(shè),這次也獲得了兩項(xiàng)提名獎。
應(yīng)該來說,通過全球用戶大會,國內(nèi)、國外的客戶之間實(shí)現(xiàn)了互動交流,我發(fā)現(xiàn)有很多國外的IT員工、CIO等對中國國內(nèi)領(lǐng)先的數(shù)據(jù)倉庫的建設(shè)特別感興趣。在工商銀行的專題演講討論中熱烈參與,并提出很多的問題和建議。這次我們?nèi)〉昧讼喈?dāng)好地與世界舞臺溝通、交流的機(jī)會,我們希望在未來加大這方面的力度,不僅是金融行業(yè)、通信行業(yè)、交通、運(yùn)輸?shù)雀餍懈鳂I(yè)都可以通過這個(gè)平臺來跟世界做交流。
問:現(xiàn)在大數(shù)據(jù)已經(jīng)成為一個(gè)行業(yè)熱點(diǎn),在您看來哪些行業(yè)或者企業(yè)更需要大數(shù)據(jù)?
答:回顧一下電腦科學(xué)的歷史,隨著市場在數(shù)據(jù)分析領(lǐng)域的需求日趨提高,許多的廠家更加專注研發(fā)數(shù)據(jù)分析的技術(shù)和應(yīng)用。特別在過去幾年,隨著技術(shù)的創(chuàng)新,以及數(shù)據(jù)的蓬勃發(fā)展,不僅是數(shù)據(jù)量越來越大,它的分析維度越來越精細(xì),它的結(jié)構(gòu)越來越豐富,它的關(guān)系程度也越來越復(fù)雜,所以更多的企業(yè)在數(shù)據(jù)整合、探索和挖掘、分析、進(jìn)而采取行動等方面的需求與日俱增,已經(jīng)從過去的傳統(tǒng)結(jié)構(gòu)化數(shù)據(jù),延伸到半結(jié)構(gòu)化或者非結(jié)構(gòu)化、或者多元結(jié)構(gòu)化的數(shù)據(jù)分析。
隨著對深度、廣度和時(shí)效性的需求,各個(gè)企業(yè)陸陸續(xù)續(xù)都提出這樣的數(shù)據(jù)分析需求。企業(yè)在信息資產(chǎn)管理的基礎(chǔ)建設(shè)逐步成熟后,過去在金融或者通信行業(yè)的客戶更早地提出這方面的需求。最近幾年,政府、能源、制造業(yè)、通信、航空、交通、運(yùn)輸,各行各業(yè)都迫切需要建設(shè)這種能力,去分析探索數(shù)據(jù)背后的價(jià)值。
我覺得大數(shù)據(jù)不是一兩個(gè)行業(yè)的需要,而是各行各業(yè)都有需求,不僅是國外有大數(shù)據(jù)分析的需求,在中國也一樣受到關(guān)注。那大數(shù)據(jù)有哪些共性:從數(shù)據(jù)分析領(lǐng)域來講,它的共性是要求企業(yè)具備三種能力去建設(shè)數(shù)據(jù)分析:它要有整合企業(yè)數(shù)據(jù)的能力,整合數(shù)據(jù)以后,構(gòu)建挖掘、探索潛在商業(yè)價(jià)值的能力,制定精確的行動綱領(lǐng),采取高效行動的能力。所以,建立整合、探索和行動這三種能力是非常重要的。
問:您覺得大數(shù)據(jù)與傳統(tǒng)的商業(yè)智能有什么區(qū)別和聯(lián)系呢?
答:當(dāng)以前講到BI,當(dāng)時(shí)沒有全面性的IT工具去協(xié)助廠商針對于商業(yè)各種不同結(jié)構(gòu)的數(shù)據(jù)進(jìn)行分析,同時(shí)通過分析將商業(yè)數(shù)據(jù)轉(zhuǎn)換成企業(yè)有用的信息,從有用的信息歸納總結(jié)成為真正協(xié)助企業(yè)成長的知識。
以前更多提到所謂的BI,是針對結(jié)構(gòu)化數(shù)據(jù)分析的范疇。過去這幾年來,隨著IT的創(chuàng)新,它的能力已經(jīng)不只是處理結(jié)構(gòu)化數(shù)據(jù),因?yàn)樵S多網(wǎng)站、日志、文本、社交媒體、機(jī)器新生成的數(shù)據(jù)也需要并值得去分析。這些數(shù)據(jù)都不是以結(jié)構(gòu)化的結(jié)構(gòu)存儲的,以前可能沒有這方面的工具去分析這類數(shù)據(jù),但是現(xiàn)在有了這方面的技術(shù),F(xiàn)在有些廠家提供的工具,是能夠幫助滿足各方面各種不同數(shù)據(jù)結(jié)構(gòu)的需求。
問:大數(shù)據(jù)行業(yè)現(xiàn)在特別熱,有機(jī)構(gòu)預(yù)測未來兩年可能全球會有超過400萬個(gè)新的工作崗位與大數(shù)據(jù)有關(guān),也會出現(xiàn)一些行業(yè)的持續(xù)并購和整合。一些風(fēng)投也比較看好大數(shù)據(jù)創(chuàng)業(yè)方面的工作,您覺得這個(gè)市場未來會有多大?
答:這可能要追溯整個(gè)信息化的演進(jìn)和發(fā)展來看,每個(gè)地區(qū)和國家信息化的建設(shè),剛開始可能都偏向于信息化的基礎(chǔ)設(shè)施建設(shè),隨著基礎(chǔ)設(shè)施建設(shè)和應(yīng)用面對操作型、交易型應(yīng)用的建設(shè)越來越趨于成熟,企業(yè)逐漸在這個(gè)領(lǐng)域上的投資會更趨向于審慎。但是,在數(shù)據(jù)分析領(lǐng)域,隨著企業(yè)面臨到更大的競爭,隨著內(nèi)部智慧化運(yùn)營及提升利潤的要求,企業(yè)會逐步篩選相應(yīng)良好的信息化流程和工具,協(xié)助完成數(shù)據(jù)分析工作。
因?yàn)榇髷?shù)據(jù)涵蓋的是多重維度多元化數(shù)據(jù)的需要,已經(jīng)不再只是協(xié)助分析關(guān)系型數(shù)據(jù)。我們感到更多地是用戶、客戶在這方面的投入越來越大,因?yàn)檫@樣能夠駕馭數(shù)據(jù)形成有用的信息,協(xié)助他們具體提高生產(chǎn)力和競爭力。當(dāng)然隨著這方面投入的增加,相應(yīng)地對人才的需要、工作崗位的需求會增加,而且隨著科技創(chuàng)新,以及廠商在這個(gè)方面的研發(fā),可能會越來越傾向于在該領(lǐng)域加強(qiáng)投資。
問:大數(shù)據(jù)對企業(yè)經(jīng)營來說,如果可以有一個(gè)良好的分析決策,對企業(yè)的影響會是很良性的。比如,客戶在面臨大數(shù)據(jù)的時(shí)候,經(jīng)常會有哪些需求和要求?
答:以前在所謂結(jié)構(gòu)化數(shù)據(jù)分析工具的層面上,沒有辦法通過那樣的工具分析這些新的數(shù)據(jù)。比如,對于網(wǎng)絡(luò)日志的分析,去分析網(wǎng)站用戶發(fā)布的東西,過去可能通過一些關(guān)系型數(shù)據(jù)的工具去分析,也可以做,但是不是一個(gè)最佳、最有效的工具。比如,機(jī)器生成的數(shù)據(jù),這個(gè)數(shù)據(jù)不是按照結(jié)構(gòu)化的關(guān)系存儲的,或者很多數(shù)據(jù)的元素并不知道彼此之間的關(guān)系,也就是這種關(guān)系可能是未知的,需要通過探索的手段才能獲得彼此之間的關(guān)系。
以前CIO都想去解決這方面的問題,但是依靠過去的技術(shù)手段是沒有辦法有效實(shí)現(xiàn)的,現(xiàn)在通過像Teradata等廠商研發(fā)的工具,有能力去處理這方面的需求。
您說現(xiàn)在客戶對大數(shù)據(jù)有哪些需求點(diǎn),我覺得可能目前還只是一部分的需求。在之前傳統(tǒng)的商業(yè)世界里,我們?nèi)ビ涗浛蛻舻男袨,往往是具體發(fā)生一筆交易才會去記錄,或者說只是一些很具體發(fā)生的接觸點(diǎn)才會記錄,F(xiàn)在,客戶、產(chǎn)品相關(guān)的地理位置信息,這些信息記錄下來都是大數(shù)據(jù),網(wǎng)站的留言、語音、視頻、圖像的分析等都是大數(shù)據(jù)的應(yīng)用。
另外一個(gè)就是現(xiàn)在用的比較多的傳感器,物流行業(yè)大量用到傳感器技術(shù)。就傳感器來說,有部分?jǐn)?shù)據(jù)是數(shù)字的,還有很多非數(shù)字化的信息,比如文本、圖像等。在噴氣發(fā)動機(jī)的運(yùn)行監(jiān)控中,現(xiàn)在有很多傳感器可以獲取它的信息,但實(shí)際上還是需要人去分析,那些都是大數(shù)據(jù),還是不太好處理的數(shù)據(jù)。又例如,今天企業(yè)想很好地處理客戶信息多渠道的協(xié)同,可以客戶訪問企業(yè)網(wǎng)站的信息,結(jié)合這個(gè)客戶去柜臺或呼叫中心的情況進(jìn)行分析。這在以前是不太容易做到的,今天利用Aster SQL-MapReduce都已經(jīng)能做到多渠道的協(xié)同分析了。針對這些,現(xiàn)在已經(jīng)有成功的案例了。
例如,在銀行業(yè)里,能夠保留并成長客戶是很重要的,所以他們對客戶的滿意度是相當(dāng)專注的。舉個(gè)典型例子,如果有一個(gè)客戶通過呼叫中心抱怨,你上個(gè)月怎么收了我25塊,說這是什么費(fèi)用。如果客戶通過呼叫中心可能會抱怨說兩遍,銀行也沒有怎么注意,然后他通過銀行的網(wǎng)站再投訴,銀行也沒有怎么注意,而這個(gè)客戶再通過銀行各種不同渠道再投訴,通常經(jīng)過這幾次以后,他就覺得銀行根本就不是從客戶服務(wù)的立場出發(fā),客戶流失的風(fēng)險(xiǎn)必然大大提升。如果銀行有這方面的能力,就能知道有客戶之前在哪些渠道已投訴,那就必須注意了。
問:在互聯(lián)網(wǎng)行業(yè),從數(shù)據(jù)上來說,F(xiàn)acebook在全球注冊活躍用戶已經(jīng)超過了十億,它產(chǎn)生的數(shù)據(jù)量是非常巨大的,就像針對這種互聯(lián)網(wǎng)行業(yè)公司,咱們能給他們哪些服務(wù)?
互聯(lián)網(wǎng)公司平時(shí)要處理非常大的數(shù)據(jù)量,除了數(shù)據(jù)量大以外,還有非常多的文字、圖片、視頻、聲音等。直到今天為止,這當(dāng)中絕大部分的內(nèi)容還是沒有被很好利用,除了文字以外,還沒有很好地利用真正發(fā)掘出來的價(jià)值,那里還是未開發(fā)的寶庫。
互聯(lián)網(wǎng)企業(yè)無論是eBay、Facebook等,因?yàn)樗,我們?yīng)該從IT應(yīng)用的角度稍微拆一下。不管是做什么,最終還是一個(gè)企業(yè),總是要有財(cái)務(wù)系統(tǒng)、有客戶服務(wù)系統(tǒng)、有員工管理系統(tǒng),這些都是傳統(tǒng)的。這些都有非常成熟的解決方案。在互聯(lián)網(wǎng)行業(yè),大家比較關(guān)心相對較成熟的大數(shù)據(jù)子集,如社交相關(guān)的應(yīng)用以及移動技術(shù)的應(yīng)用等。使用Teradata Aster的技術(shù),包括Hadoop的技術(shù),實(shí)際上是可以產(chǎn)生出較多的價(jià)值。例如,根據(jù)人的定位,根據(jù)倆人之間是不是有微博的關(guān)系,就能判斷出更多屬性,做出更好的服務(wù)或者更好的風(fēng)險(xiǎn)控制等等。
今天的互聯(lián)網(wǎng)企業(yè)已經(jīng)在應(yīng)用這方面的技術(shù),包括Teradata也可以提供這方面的技術(shù)。有些是用Hadoop在做,有些是用Aster在做,還有一些是用Teradata的技術(shù)在做。
具體來講,圖的分析、各種關(guān)系的分析,甚至說直接按照拓?fù)溆?jì)算的地理信息,這都是今天Teradata大的技術(shù)群、產(chǎn)品群很成熟的技術(shù),已經(jīng)具有很成熟的案例,比如LinkedIn就是在使用Aster和Hadoop技術(shù)。比如eBay,每天處理大量的交易信息,涉及大量的客戶、風(fēng)險(xiǎn)管控、產(chǎn)品推廣等,現(xiàn)在主要使用Teradata在同一個(gè)系統(tǒng)中實(shí)現(xiàn)。
問:這種類型的大型互聯(lián)網(wǎng)公司,將來會在某一個(gè)方面,在數(shù)據(jù)分析方面會和Teradata成為競爭對手?如果很多做數(shù)據(jù)分析的互聯(lián)網(wǎng)企業(yè),像Facebook這樣做到了非常大的量,自己本身就是一個(gè)大數(shù)據(jù)主要的領(lǐng)導(dǎo)者。
答:我覺得不會存在這種競爭的關(guān)系,對我們來講,這是不同生態(tài)鏈上的企業(yè)。我不認(rèn)為這些企業(yè)會從現(xiàn)在的價(jià)值鏈、業(yè)務(wù)鏈上突然跳出來。
價(jià)值鏈和業(yè)務(wù)鏈很重要,Teradata是技術(shù)解決方案提供商,我們的專注和互聯(lián)網(wǎng)公司的專注不同。我們更加專注提供科技、技術(shù)、產(chǎn)品、平臺、咨詢和服務(wù),提供給各行各業(yè)的企業(yè),終極目標(biāo)就是激發(fā)企業(yè)的商業(yè)的潛能,提升它們的生產(chǎn)力和競爭力;ヂ(lián)網(wǎng)企業(yè)可能更多是利用現(xiàn)在的技術(shù),去提升自身在互聯(lián)網(wǎng)領(lǐng)域的潛能,專注還是不同的。
問:之前您接受采訪也說過,現(xiàn)在大數(shù)據(jù)還遠(yuǎn)遠(yuǎn)沒到爆發(fā)期,您覺得大數(shù)據(jù)的爆發(fā)期未來會在什么時(shí)候到來?比如說在未來的五到十年,大數(shù)據(jù)會有什么樣的走勢?
答:我們可以追溯一下,傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)是在20世紀(jì),而且這種發(fā)展長達(dá)四五十年。從過去結(jié)構(gòu)化的數(shù)據(jù)到現(xiàn)在有能力處理半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),其間發(fā)展時(shí)間應(yīng)該也不超過五年,也就是最近這四五年的事情。
所以,現(xiàn)在根本都還沒有到爆發(fā)期,還是一個(gè)發(fā)展期階段。我覺得至少在未來幾年,隨著更多在分析領(lǐng)域底層基礎(chǔ)技術(shù)的發(fā)展,開發(fā)更多良好的易于使用的工具,會加快發(fā)展的速度。但目前,我覺得應(yīng)該是在發(fā)展期的階段。
問:您覺得未來五到十年會發(fā)展到一個(gè)什么樣的程度?
答:我覺得未來五年肯定還是一個(gè)發(fā)展的階段。會有更多廠商提供更好的商業(yè)工具,因?yàn)椴皇撬械膹S家都能夠去組織龐大的IT團(tuán)隊(duì)去開發(fā)開源的Hadoop工具,可能有一些廠家要去扮演所謂的中間階層的角色,把良好的易于使用的工具提供給企業(yè)。
問:針對中國目前的大數(shù)據(jù)市場,Teradata中國有沒有專門針對中國市場的信息可以跟大家分享?
答:我們?nèi)ツ?月收購了Aster data。在第三方評估來看,Aster Data在半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)分析領(lǐng)域是全球領(lǐng)先的廠家,Teradata專注36年研發(fā)結(jié)構(gòu)化數(shù)據(jù)分析,通過這次并購已經(jīng)延伸了Teradata的能力,具有處理各種不同結(jié)構(gòu)數(shù)據(jù)分析的能力。目前,我們在國內(nèi)推廣Aster Data,初步已經(jīng)見到相當(dāng)好的成效,同許多通信行業(yè)、金融行業(yè)、制造行業(yè)領(lǐng)域的客戶一起合作。應(yīng)該講,目前合作的初級階段就已經(jīng)取得了相當(dāng)不錯(cuò)的進(jìn)展。