語(yǔ)音門(mén)戶(hù)的革命
英特爾公司Dialogic分部語(yǔ)音部技術(shù)營(yíng)銷(xiāo)經(jīng)理GeneEagle先生
電子商務(wù)是當(dāng)今世界最熱門(mén)的商業(yè)趨勢(shì),而語(yǔ)音門(mén)戶(hù)正在迅速成為電子商務(wù)中的熱點(diǎn);谡Z(yǔ)音的互聯(lián)網(wǎng)門(mén)戶(hù),也就是語(yǔ)音門(mén)戶(hù),代表著計(jì)算機(jī)語(yǔ)音與互聯(lián)網(wǎng)融合的新趨勢(shì)。
語(yǔ)音門(mén)戶(hù)讓用戶(hù)可隨時(shí)隨地輕松獲取各種信息。例如,用戶(hù)只需撥打語(yǔ)音門(mén)戶(hù)網(wǎng)的800號(hào)碼,就可在引導(dǎo)之下便捷瀏覽所需信息。在這個(gè)過(guò)程中,無(wú)須鍵入菜單選擇,僅需簡(jiǎn)單的語(yǔ)音應(yīng)答即可完成操作。所以,語(yǔ)音門(mén)戶(hù)簡(jiǎn)單易用--無(wú)論是通過(guò)PC機(jī)、手機(jī)、還是固定電話(huà),也無(wú)論是在辦公室、家中、還是在路上、車(chē)上,“瀏覽”網(wǎng)絡(luò)的過(guò)程變得輕松無(wú)比!
由于語(yǔ)音技術(shù)的發(fā)展,語(yǔ)音門(mén)戶(hù)將電話(huà)交互過(guò)程從以廠商為中心轉(zhuǎn)向以用戶(hù)為中心。這一轉(zhuǎn)變?cè)跒橛脩?hù)提高效率和降低業(yè)務(wù)成本的同時(shí),還將提高用戶(hù)的滿(mǎn)意度。
未來(lái)數(shù)年,語(yǔ)音門(mén)戶(hù)將大大改變?nèi)藗兪褂秒娫?huà)的方式以及廠商與主叫用戶(hù)溝通的方式。在當(dāng)今以廠商為中心的模式中,主叫用戶(hù)只能以?huà)鞌嚯娫?huà)的方式來(lái)“擺脫”某一企業(yè)的交互式語(yǔ)音應(yīng)答(IVR)系統(tǒng)。而在未來(lái)以用戶(hù)為中心的模式中,主叫用戶(hù)可與語(yǔ)音門(mén)戶(hù)展開(kāi)交互式對(duì)話(huà),可以象“網(wǎng)上沖浪”般快捷、方便地從一家企業(yè)自由地“跳”到另外一家企業(yè)。
語(yǔ)音技術(shù)炙手可熱
語(yǔ)音技術(shù)是當(dāng)今迅猛發(fā)展的電子商務(wù)經(jīng)濟(jì)最重要的“推進(jìn)器”之一。語(yǔ)音技術(shù)市場(chǎng)正在迅速成長(zhǎng),且發(fā)展勢(shì)頭良好。分析家預(yù)測(cè),從1999年到2004年,語(yǔ)音技術(shù)市場(chǎng)將以每年31%的速度持續(xù)增長(zhǎng)。語(yǔ)音技術(shù)市場(chǎng)的迅速擴(kuò)展意味著我們正面臨大量部署語(yǔ)音應(yīng)用的轉(zhuǎn)折期。
語(yǔ)音技術(shù)如此“火爆”有幾方面的原因,這既與語(yǔ)音技術(shù)本身有關(guān),同時(shí)也因?yàn)檎Z(yǔ)音技術(shù)能夠讓開(kāi)發(fā)商不斷創(chuàng)建出真正滿(mǎn)足現(xiàn)實(shí)用戶(hù)需求的應(yīng)用。比如,90年代早期,簡(jiǎn)單的語(yǔ)音應(yīng)用只支持詞匯較少的(20到30個(gè)單詞)命令和控制指令,且只能識(shí)別不連續(xù)的數(shù)字,F(xiàn)在,在我們的眼前卻出現(xiàn)了諸如虛擬個(gè)人助理、股票交易代理、企業(yè)內(nèi)自動(dòng)值守、旅游訂票系統(tǒng)和許多其他可實(shí)現(xiàn)語(yǔ)音功能的復(fù)雜應(yīng)用。在不遠(yuǎn)的未來(lái),在公網(wǎng)中更將出現(xiàn)象由大型詞匯表(一百萬(wàn)字條)支持的自動(dòng)目錄幫助、企業(yè)應(yīng)用托管,如語(yǔ)音門(mén)戶(hù)這樣的應(yīng)用。
技術(shù)使然
未來(lái)語(yǔ)音應(yīng)用的關(guān)鍵在于語(yǔ)音技術(shù)的發(fā)展。在過(guò)去幾年里,ASR引擎的精確度和詞匯量已經(jīng)大大提升。精確的算法、顯著增強(qiáng)的處理能力、更低的成本和實(shí)現(xiàn)自助溝通、連續(xù)語(yǔ)音的更強(qiáng)大技術(shù)推動(dòng)了這些進(jìn)步。Barging技術(shù)也已完善,可使主叫用戶(hù)根據(jù)提示進(jìn)行應(yīng)答,并且可識(shí)別用戶(hù)的應(yīng)答。自然語(yǔ)言功能的推出也對(duì)語(yǔ)音應(yīng)用的用途產(chǎn)生了極大影響。
服務(wù)提供商扮演的角色增多
除了新型技術(shù)的出現(xiàn)和原有技術(shù)的發(fā)展外,在當(dāng)今具有強(qiáng)大影響力的語(yǔ)音應(yīng)用發(fā)展大潮中,另外一個(gè)關(guān)鍵因素是技術(shù)供應(yīng)商變換了自己的角色。當(dāng)今的服務(wù)提供商(主要是過(guò)去的算法供應(yīng)商)已經(jīng)發(fā)展成為全方位的提供者,擁有大批人文因素設(shè)計(jì)、應(yīng)用分析、系統(tǒng)分析、語(yǔ)言學(xué)和電話(huà)應(yīng)用開(kāi)發(fā)方面的專(zhuān)家,他們推出了廣泛的專(zhuān)業(yè)服務(wù),支持創(chuàng)建、部署和維護(hù)高級(jí)語(yǔ)音應(yīng)用的功能。
新型測(cè)試工具大大縮短了開(kāi)發(fā)時(shí)間
應(yīng)用測(cè)試已經(jīng)大大改進(jìn),使技術(shù)供應(yīng)商開(kāi)發(fā)可快速、持續(xù)部署的應(yīng)用成為可能。
現(xiàn)在,從一種新型應(yīng)用的基本研究設(shè)計(jì)開(kāi)始,開(kāi)發(fā)商就可謹(jǐn)慎地、小規(guī)模地進(jìn)行測(cè)試,然后將測(cè)試的結(jié)果不斷反饋運(yùn)用到開(kāi)發(fā)過(guò)程中,直到可部署實(shí)際應(yīng)用為止。一旦一個(gè)應(yīng)用實(shí)際部署之后,開(kāi)發(fā)商可將這一技能應(yīng)用到其他類(lèi)似的應(yīng)用中,這樣,大規(guī)?焖俨渴鹦滦蛻(yīng)用變得更簡(jiǎn)單輕松。
同時(shí),技術(shù)開(kāi)發(fā)商也投入了很多精力來(lái)開(kāi)發(fā)可方便快速部署應(yīng)用的強(qiáng)力工具。對(duì)話(huà)應(yīng)用組件(DAC)便是這樣一種高級(jí)程序工具,它溶聚了大量從應(yīng)用對(duì)話(huà)設(shè)計(jì)和與經(jīng)常性用戶(hù)交互中獲得的大量寶貴經(jīng)驗(yàn)和知識(shí)。例如,DAC可包含小程序,這些小程序允許用戶(hù)從目錄中選擇項(xiàng)目、讓?xiě)?yīng)用程序收集信用卡號(hào)碼、接收“是”或“不是”這樣的回答、獲取旅行出發(fā)點(diǎn)和目的地的信息、或查看股票價(jià)格等。通過(guò)提供可再利用目標(biāo)程序中的專(zhuān)門(mén)技術(shù),DAC可大大縮短開(kāi)發(fā)新型應(yīng)用的時(shí)間。過(guò)去需30人、數(shù)年才能開(kāi)發(fā)出的應(yīng)用,現(xiàn)在利用更少的人員、在數(shù)月甚或數(shù)周之內(nèi)即可開(kāi)發(fā)出來(lái)。
文本轉(zhuǎn)語(yǔ)音已經(jīng)實(shí)現(xiàn)
除了語(yǔ)音識(shí)別技術(shù)之外,文字轉(zhuǎn)換為語(yǔ)音(TTS)的技術(shù)也大大提高,成為促進(jìn)語(yǔ)音門(mén)戶(hù)發(fā)展的另一塊重要因素。過(guò)去由于語(yǔ)音轉(zhuǎn)換質(zhì)量差,阻礙了TTS的廣泛應(yīng)用,而最新一代的TTS技術(shù)顯著地提高了語(yǔ)音轉(zhuǎn)換的質(zhì)量。語(yǔ)言支持也得到很大的提高。此外,TTS現(xiàn)實(shí)應(yīng)用中至關(guān)重要的組件——處理“臟(不正規(guī))”數(shù)據(jù)的預(yù)處理器已經(jīng)開(kāi)發(fā)出來(lái)。可修正、處理諸如首字母縮寫(xiě)詞、縮略詞和聲調(diào)的電子郵件預(yù)處理器,也使通過(guò)電話(huà)閱讀電子郵件信息的應(yīng)用成為可能。
互聯(lián)網(wǎng)的發(fā)展
互聯(lián)網(wǎng)電子交易革命使人們對(duì)即時(shí)信息接入和強(qiáng)大的交易處理功能寄予厚望。為了滿(mǎn)足這種期望,業(yè)界在開(kāi)發(fā)以HTML等腳本語(yǔ)言為基礎(chǔ)的基礎(chǔ)設(shè)施方面已經(jīng)開(kāi)展了大量的工作。
新型具有語(yǔ)音功能的語(yǔ)言,諸如VoiceXML,正在將互聯(lián)網(wǎng)的功能擴(kuò)展到電話(huà)上,F(xiàn)在,具有語(yǔ)音功能的語(yǔ)言不僅可以利用現(xiàn)有的基礎(chǔ)設(shè)施,并可對(duì)支持互聯(lián)網(wǎng)的整個(gè)基礎(chǔ)設(shè)施進(jìn)行補(bǔ)充,將互聯(lián)網(wǎng)的基礎(chǔ)設(shè)施擴(kuò)展到客戶(hù)機(jī)/服務(wù)器架構(gòu)中,其結(jié)果是產(chǎn)生了可由基于互聯(lián)網(wǎng)的遠(yuǎn)程應(yīng)用來(lái)控制的、具有強(qiáng)大功能的語(yǔ)音服務(wù)器平臺(tái)。
具有語(yǔ)音功能的IVR的發(fā)展
可實(shí)現(xiàn)語(yǔ)音功能的交互式語(yǔ)音應(yīng)答系統(tǒng)(IVR)的發(fā)展速度非常迅猛。比如,您可考察一下利用800號(hào)碼提供主叫用戶(hù)接入服務(wù)的企業(yè)。最初的情況是用戶(hù)撥打800號(hào)碼,然后接到提供服務(wù)的人員處。但企業(yè)很快認(rèn)識(shí)到人員配備成本昂貴,許多工作可采用自動(dòng)處理方式,從而節(jié)約成本開(kāi)支。IVR系統(tǒng)即可實(shí)現(xiàn)這種自動(dòng)處理。企業(yè)下一步就是將IVR系統(tǒng)與數(shù)據(jù)庫(kù)集成在一起,以便IVR系統(tǒng)可動(dòng)態(tài)地處理信息。這樣,主叫用戶(hù)利用計(jì)算機(jī)語(yǔ)音集成(CTI)技術(shù)接入企業(yè)的IVR系統(tǒng),之后,這一呼叫被IVR系統(tǒng)實(shí)時(shí)轉(zhuǎn)移到相關(guān)人員處,同時(shí),個(gè)性化的主叫用戶(hù)信息(比如未完成的訂貨情況)可通過(guò)彈出的屏幕傳遞給這一處理人員,這為企業(yè)提供最好的服務(wù)建立了堅(jiān)實(shí)的基礎(chǔ)。另外,通過(guò)使IVR系統(tǒng)前端具有語(yǔ)音功能,強(qiáng)大的ASR功能可使企業(yè)節(jié)省更多成本。
對(duì)主叫用戶(hù)而言,語(yǔ)音意味著更自然和更舒適的界面?蓪(shí)現(xiàn)語(yǔ)音功能的IVR應(yīng)用也比雙音多頻(DTMF)、或按鈕應(yīng)用更方變。這將帶來(lái)更好的投資回報(bào)。
語(yǔ)音門(mén)戶(hù)網(wǎng)革命
到2001年,全球?qū)⒂?0億多部電話(huà)投入使用,任何企業(yè)都不應(yīng)該置身于這些用戶(hù)視線(xiàn)之外,否則后果不堪設(shè)想。企業(yè)非常需要借助語(yǔ)音門(mén)戶(hù)網(wǎng),向用戶(hù)提供接入服務(wù)。在服務(wù)提供商的基礎(chǔ)設(shè)施中添加的語(yǔ)音門(mén)戶(hù)網(wǎng),將從根本上改變企業(yè)與用戶(hù)“溝通”的方式,以及用戶(hù)與企業(yè)互動(dòng)的方式。