再次見到鄭裕慶先生則是在2012年初冬的一個有風(fēng)的午后,位于三元橋附近的Nuance北京辦公室, 簡潔的設(shè)計結(jié)合Nuance 綠色標(biāo)志,陽光斜射在會議室中侃侃而談的鄭裕慶先生臉上,這是一張有著溫和微笑的臉,也是寫滿了自信的臉;厥走@兩年Nuance通訊公司在大中華區(qū)的業(yè)績,就足以記載了他這3年多來帶領(lǐng)Nuance團隊所做的努力。
上圖為:Nuance通訊公司大中華區(qū)總經(jīng)理鄭裕慶 (Daniel Cheng)
自然語言理解技術(shù)
CTI論壇記者:語音的應(yīng)用,最為廣泛的就是語音合成及語音識別。Nuance最近總談到自然語言理解技術(shù),何為自然語言理解技術(shù)?
鄭裕慶:Nuance自然語言理解技術(shù)是基于語音識別技術(shù)研發(fā)的針對人類語義理解的更加智能的語音技術(shù),圍繞一些命令來做。以前的語音技術(shù)水平達不到語義理解,比如語音對話:“今天我應(yīng)該穿長袖還是短袖?”傳統(tǒng)的語音識別技術(shù)引擎是處理不了的,要么不能識別,要么只是播報一下天氣預(yù)報,Nuance自然語言理解技術(shù)引擎能告知今天是什么溫度,天氣很熱,適合短袖著裝,因而能更加深入的理解復(fù)雜的問題,明確理解問題的目的。
CTI論壇記者:自然語言理解技術(shù)的技術(shù)原理是什么?如何實現(xiàn)?有哪些特點及優(yōu)勢?
鄭裕慶:實際上,自然語言處理,實現(xiàn)人機自然語言通信,或?qū)崿F(xiàn)自然語言理解和自然語言生成是十分困難的。造成困難的根本原因是自然語言文本和對話的各個層次上廣泛存在的各種各樣的歧義性或多義性,因此,自然語言的形式與其意義之間是一種多對多的關(guān)系,這也正是自然語言的魅力所在。
CTI論壇記者:自然語言理解技術(shù)的主要應(yīng)用表現(xiàn)在哪些方面?
鄭裕慶:我們委托Vocal Laboratories Inc. (Vocalabs) 進行的一項最新調(diào)查顯示,三分之二的消費者在使用客戶服務(wù)咨詢時更傾向于使用自助服務(wù),而非與坐席交談。 該調(diào)查也指出,便利是最重要的影響因素。75%的消費者認(rèn)為自助服務(wù)更方便,相比之下,只有6%的人認(rèn)為與坐席交談的方式是最方便的。
我們在國內(nèi)有一家銀行的案例,以前客戶不知道該如何使用語音導(dǎo)航,發(fā)現(xiàn)最終用戶的電話總是被轉(zhuǎn)錯,因為語音導(dǎo)航并不是簡單的代替按鍵。
Nuance會根據(jù)客戶的最終用戶來設(shè)計方案,最終用戶只需要用語言來表達自己所需要的服務(wù),需不是讓用戶來記住這個業(yè)務(wù)叫什么名字。比如在辦理銀行業(yè)務(wù)時,你可以直接用語音表達:“我要轉(zhuǎn)3000塊錢”或者說:“我要從儲蓄卡賬戶轉(zhuǎn)到我信用卡賬戶”,而不需要讓最終用戶記住銀行的這個業(yè)務(wù)的標(biāo)準(zhǔn)名稱叫“轉(zhuǎn)賬”。
所以,自然語言理解技術(shù)在應(yīng)用方面的拓展性是比較強的,銀行、保險、電信、移動互聯(lián)網(wǎng)等領(lǐng)域都能廣泛應(yīng)用,此外,語音應(yīng)用已成功引入數(shù)字客廳,領(lǐng)先的智能電視生產(chǎn)商如LG、松下和三星今年先后就已推出了使用Nuance語音識別技術(shù)的智能電視設(shè)備。
語音與移動互聯(lián)網(wǎng)
CTI論壇記者: Nuance也推出了Android版語音助手,有媒體說是在正面對抗Siri,同屬于移動終端的應(yīng)用,這樣的策略對Nuance意味著什么?
鄭裕慶:Nuance是一家提供語音和語言技術(shù)的廠商,可以為客戶提供語音方案或訂制服務(wù),我們都是期望能帶給大家語音方面的便捷。
CTI論壇記者:當(dāng)然,也有一些用戶反映市場上語音應(yīng)用的識別率不是特別高,在本土化方面,Nuance會如何部署去迎合中國用戶的習(xí)慣?
鄭裕慶:Nuance為了順應(yīng)中國大陸地區(qū)用戶的習(xí)慣,在中國設(shè)有自己的研發(fā)中心和服務(wù)團隊。采集了南到廣州,福建,北到黑龍江,甚至西北等全國的語音數(shù)據(jù),使得Nuance在識別即便帶口音的普通話時,也具有非常高水準(zhǔn)的識別率。同時,開發(fā)、銷售及服務(wù)的本土化,也有助于進一步降低成本,加速Nuance語音識別技術(shù)在中國市場的推進步伐。
以前Nuance的語音引擎搜索是在國外的團隊負(fù)責(zé)開發(fā)的的,比如美國的地址一般是哪一個區(qū)、哪一個街道、哪一個門牌號,而上海的地址則習(xí)慣于寫某條街與某條街的交匯處,直接寫大廈名稱等,另外,中國還習(xí)慣寫簡稱,比如上海交通大學(xué)簡稱交大。這些本土化應(yīng)用以前是沒有的,現(xiàn)在國內(nèi)的應(yīng)用都已經(jīng)開發(fā)完成。
CTI論壇記者:語音應(yīng)用于移動互聯(lián)網(wǎng)最需要解決的難題是接口還存在很大限制,這方面Nuance有沒有什么樣的改進計劃?
鄭裕慶:Nuance目前在移動互聯(lián)網(wǎng)領(lǐng)域的接口幾乎沒有很大的限制,我們都有預(yù)留接口,這對我們不存在困難。
云端加嵌入式
CTI論壇記者:我看到Nuance最新推出了的一種混合性的解決方案,云端加嵌入式,具體方案背景是什么?
鄭裕慶:云端加嵌入式的解決方案,讓本地可以處理的問題就在本地處理,而不需要放在云端,比如電視的語音應(yīng)用,開關(guān)機就可以安裝在本地,其它應(yīng)用放在云端。
另一方面,手機和汽車的語音技術(shù)嵌入式應(yīng)用也比較廣泛,在歐美市場,福特汽車一直采用Nuance的語音識別技術(shù)。在中國市場,新?怂共捎玫牡谝淮鶶YNC系統(tǒng)也是采用了Nuance的語音識別技術(shù)。另外,奧迪、寶馬、奔馳、豐田等都是Nuance的客戶,在不遠(yuǎn)的將來也會有配備語音識別的新車型上市。
Nuance結(jié)合嵌入式和云端的解決方案,其優(yōu)點是在用戶體驗和效果方面,F(xiàn)在所有的國內(nèi)廠家都是在做基于云端的解決方案,但Nuance提供的就是結(jié)合嵌入式和云端的解決方案。這樣,很多本地功能都可以實現(xiàn),不需要靠云端去做。無需通過網(wǎng)絡(luò)也能提供的服務(wù)。
CTI論壇記者:語音技術(shù)最怕的噪音如何處理?
鄭裕慶:Nuance 的語音解決方案擁有良好的抗噪性,并有業(yè)界認(rèn)可的Benchmark進行測試,其中國內(nèi)公司跟Nuance最沒法比的就是遠(yuǎn)距離的語音識別。Nuance提供的語音技術(shù)的抗噪性可算是領(lǐng)先全球,我們有一個團隊專門針對這方面提供解決方案,目前已有十二年的經(jīng)驗積累。在家電、電視機、汽車上應(yīng)用語音技術(shù),抗噪性的好壞會直接影響終端用戶對它的接受性和用戶體驗,所以是非常關(guān)鍵的。怎么去處理噪音,同時保持高識別率是非常困難的。
以汽車為例,在一個房間里面或是停著車,開著30公里、100公里、開窗、開雨刷、人的叫聲、開著音樂,這都是完全不同的環(huán)境。所以有一些我們的競爭對手,說自己的語音識別還不錯,但是測試都只是在一個特定環(huán)境里做,但一旦到了一個完全不統(tǒng)一的環(huán)境,他們的東西就變得用不了。
中國是比較新的市場,很多人不知道怎么去測試語音的功能。在測試方面,我們也在教育我們的那些客戶如何做測試才是標(biāo)準(zhǔn),才可以跟其他的去比哪個技術(shù)比較好。如果沒有一個方法論,就沒辦法進行類比。
有一些國內(nèi)的競爭對手,一方面價格便宜,另一方面先幫你做完才收費,但后來發(fā)覺免費也不是好事,用戶體驗不好,車的品牌都受到影響。現(xiàn)在慢慢再教育這個行業(yè),但是高端的汽車或真的很好的品牌,他們測試是很嚴(yán)格的,之后才去選擇,這才是最好的方法。
從技術(shù)本身來說,Nuance有一種獨有的算法,專門把風(fēng)噪聲降下來,比如在車?yán),如果打開車窗,主要噪聲來源是風(fēng)噪聲,如果在屏幕上看波形,實際上語音的波形被噪聲完全淹沒了,但是我們有一個很好的算法可以把風(fēng)噪聲去除。
另外,還有其他像脈沖做成的這種聲音,我們也有專門的算法。此外,另一種是針對揚聲器的播出聲音,揚聲器操作會發(fā)出聲音,甚至有時候就是語音對話,語音界面系統(tǒng)的提示音會告訴你干什么,但你不需等提示音結(jié)束便可說話,等于兩種聲音一塊進去,但是它就可以把揚聲器的聲音屏蔽掉,光把你的聲音錄進去做識別,這個技術(shù)叫回聲消除(Echo Cancellation)。
汽車抗噪技術(shù)最難處理的是副駕駛和后排坐的人也在那里說話,這些聲音一塊進來最難處理,但是我們也有這個技術(shù),英文叫Beanforming,用中文說就相當(dāng)于定向,提取正常駕駛員位置上的聲音來源,其他的地方屏蔽掉。在抗噪技術(shù)方面,針對不同噪聲我們有不同的處理辦法。
抗噪性不光在汽車?yán),在其他?yīng)用領(lǐng)域里也有。最常見的是語音控制電視。Nuance解決方案是:人坐在沙發(fā)上,可以通過語音控制電視,其他廠家用的解決方案還得把聲音先關(guān)掉然后再說,這樣來回折騰十分麻煩。而我們這電視聲音照樣播,而我發(fā)的聲音是我發(fā)的,而且坐得老遠(yuǎn)就可以這么說著,這運用了以上介紹的幾種技術(shù),一個是回聲消除,電視出來的聲音會自動屏蔽掉,只有我說的命令能進去,這是其一。第二,沙發(fā)上坐了好幾個人,我是發(fā)命令的人,別人說話它聽不見。
免費語音不會長久
CTI論壇記者:Nuance進入中國市場已有一段時間,目前市場狀況如何?主要客戶分布情況?
鄭裕慶:我們的客戶主要在銀行、汽車、電信、保險、政府等行業(yè),另外,IPTV、移動應(yīng)用開發(fā)也是我們發(fā)展的重點,相比較而言,傳統(tǒng)呼叫中心語音技術(shù)能實現(xiàn)更好的用戶體驗,市場潛力較大,同時,客戶相對比較謹(jǐn)慎。
Nuance在中國的市場開拓非常好,目前每年以50%左右的速度在遞增。
CTI論壇記者:Nuance的主要銷售策略是什么?您怎么看待目前的語音市場?2013年有哪些規(guī)劃?
鄭裕慶:Nuance的主要銷售有直銷及渠道銷售,我們在汽車導(dǎo)航等領(lǐng)域采用直銷方式,同時,Nuance主要還與合作伙伴合作,我們目前的合作伙伴有Avaya、華為、億迅、寶東等,我們期待著與各伙伴進行緊密而有成效的合作。
語音市場目前看起來很火,你會發(fā)現(xiàn)隔一段時間就會有一些新的語音公司冒出來,嘗試著去做一些語音的開發(fā)應(yīng)用,我預(yù)計2~3年之后會有一些企業(yè)整合或者倒閉,市場會有調(diào)整。
另外,便宜的、免費的語音肯定不會長久,因為沒有后續(xù)的支持力度。
Nuance會對目前的語音方案進行優(yōu)化,我們有信心幫助本地客戶更快融入國際市場,因為我們有30多種語言做支撐。
鄭裕慶個人介紹:
鄭裕慶先生自2008年起擔(dān)任Nuance通訊公司大中華區(qū)總經(jīng)理,執(zhí)掌Nuance在該區(qū)域的企業(yè)級市場及嵌入式方案業(yè)務(wù),并負(fù)責(zé)拓展該區(qū)快速增長的客戶群。
長駐北京的鄭裕慶先生在IT行業(yè)從業(yè)近20年,對亞洲及大中華區(qū)市場有著深刻的了解。同時,他在業(yè)務(wù)拓展、運營管理、產(chǎn)品布局、客戶服務(wù)以及針對不同市場的銷售推廣等方面也都擁有豐富的經(jīng)驗。因此可以相信,鄭裕慶先生將會把Nuance 先進的語音與文字輸入技術(shù)以及完善的服務(wù)帶給客戶,從而幫助大中華區(qū)的本地及海外企業(yè)從容應(yīng)對全球化挑戰(zhàn)。
加盟Nuance之前,鄭裕慶先生曾任Business Objects大中華區(qū)的董事經(jīng)理,不僅為其營運模式及策略注入新思維,并使Business Objects銷售盈利能力及運營水平取得了明顯的進步,在市場上屢創(chuàng)佳績。
1997年,鄭裕慶先生加入賽門鐵克 (Symantec)并就職九年,擔(dān)任其中國公司董事經(jīng)理及大中華區(qū)客戶與SMB解決方案的董事。另外,鄭裕慶先生還在Borland出任過亞太區(qū)產(chǎn)品市場經(jīng)理及該公司在印度和泰國的經(jīng)理,因而擁有豐富的區(qū)域性管理經(jīng)驗。
鄭裕慶先生畢業(yè)于英國Essex大學(xué)計算機系人工智能專業(yè),獲碩士學(xué)位,他還同時擁有NewCastle大學(xué)航海及造船專業(yè)的學(xué)士學(xué)位。
聲明:CTI論壇(CTiforum)版權(quán)作品,未經(jīng)CTiforum書面授權(quán),嚴(yán)禁轉(zhuǎn)載,違者將被追究法律責(zé)任。