首頁>>廠商>>語音識別與合成>> 北京無限商機

我國語音互聯(lián)網(wǎng)產(chǎn)業(yè)的發(fā)展和統(tǒng)一標(biāo)準(zhǔn)規(guī)范VAP探討

雷百鎖 2002/03/04

主題

  以滿足中國簡易終端的服務(wù)需求為目的,利用中國電信、移動、聯(lián)通和互聯(lián)網(wǎng)服務(wù)商平臺的現(xiàn)有資源,保證任何用戶、在任何地方、使用任何終端、享受互聯(lián)網(wǎng)上的任何服務(wù)。探索中國語音信息服務(wù)業(yè)的在互聯(lián)網(wǎng)上的發(fā)展,提出中國語音數(shù)據(jù)互聯(lián)的相互促進的發(fā)展模式和全國語音應(yīng)用標(biāo)準(zhǔn)(VAP)的統(tǒng)一。促使語音數(shù)據(jù)互聯(lián)網(wǎng)的規(guī)范、良性發(fā)展,進而推進語音電子商務(wù)(V-Commerce)的應(yīng)用。澄清傳統(tǒng)聲訊和語音互聯(lián)的本質(zhì)區(qū)別,注重服務(wù)內(nèi)容的多方面參與制作優(yōu)化,避免落入聲訊服務(wù)的窠臼。固話網(wǎng)語音互聯(lián)、移動語音互聯(lián)等具有相似性,互聯(lián)網(wǎng)、ICP、運營商、系統(tǒng)集成商相互依存,相互促進,積極聯(lián)合,共同推動我國國民經(jīng)濟的繁榮和發(fā)展。

語音互聯(lián)和VoiceXML標(biāo)準(zhǔn)

  在中國,電話有著最廣泛的用戶群;追求方便時尚,希望使用互聯(lián)網(wǎng)信息、郵件而不懂或不熟悉鍵盤操作的用戶占4/5;語音互聯(lián)網(wǎng)是電話網(wǎng)與互聯(lián)網(wǎng)的完美結(jié)合,通過語音互聯(lián),普通電話用戶用自然語言對話的方式即可獲取互聯(lián)網(wǎng)的主要服務(wù),滿足用戶任何時間、任何地點、任何設(shè)備獲取信息的需求。在美國、日本,語音互聯(lián)已成為簡易終端接入互聯(lián)網(wǎng)的主要方式之一。

  由AT&T、IBM、Lucent、Motorola共同發(fā)起并,為W3C 組織接受為國際工業(yè)標(biāo)準(zhǔn)VoiceXML2.0標(biāo)準(zhǔn),實現(xiàn)了語音于互聯(lián)網(wǎng)豐富信源交互的國際標(biāo)準(zhǔn),使簡易終端設(shè)備方便實現(xiàn)語音互聯(lián)網(wǎng)交互成為現(xiàn)實。他是基于XML 的數(shù)據(jù)機制,實現(xiàn)語音與數(shù)據(jù)的融合,是Web與語音瀏覽器的統(tǒng)一,可以與數(shù)據(jù)庫、HTML、WML以及其它文檔處理和發(fā)布系統(tǒng)進行無縫資料交換。

  VoiceXML實現(xiàn)了適用于自然語音對話框交互方式的業(yè)務(wù)應(yīng)用流程和數(shù)據(jù)的頁面描述,結(jié)合傳統(tǒng)的電話語音操作控制、語音識別(ASR)、文語轉(zhuǎn)換(TTS)、XML、Web數(shù)據(jù)庫等技術(shù),完成方便、完善的業(yè)務(wù)和信息控制操作。

  自主產(chǎn)權(quán)的中文VoiceXML解釋器已經(jīng)發(fā)布,CMIS正基于VoiceXML起草中國語音互聯(lián)的技術(shù)標(biāo)準(zhǔn)及產(chǎn)品規(guī)范,可望成為中國語音應(yīng)用的規(guī)范性標(biāo)準(zhǔn)(VAP),這將推動中國經(jīng)濟的繁榮富強。

簡易終端用戶在通訊、互聯(lián)網(wǎng)的服務(wù)現(xiàn)狀和展望

  普遍存在的簡易終端在電信、移動、聯(lián)通等系統(tǒng)平臺的各種接入如PSTN、GSM、CDMA、GPRS等方式下方便的進行語音互聯(lián)業(yè)務(wù)服務(wù)。將數(shù)據(jù)增值業(yè)務(wù)在用戶、運營商、互聯(lián)網(wǎng)服務(wù)商等進行推廣。

  中國聲訊業(yè)經(jīng)歷多年的發(fā)展歷程,形成了中國特有的、最大的電話信息接入訪問服務(wù)平臺,該平臺的全省、甚至于全國統(tǒng)一聯(lián)網(wǎng)正在進行,有望成為全球最大的電話接入、商務(wù)平臺。但眾所周知,現(xiàn)有平臺的結(jié)構(gòu)和運營存在著一系列問題,其中的主要技術(shù)原因在于: 1)、平臺結(jié)構(gòu)標(biāo)準(zhǔn)不統(tǒng)一、難以聯(lián)成網(wǎng)絡(luò),全省、全國無法實時共享、管理。2)、業(yè)務(wù)信息腳本不統(tǒng)一、開發(fā)難,信息更新慢,信源枯竭、信息難以共享。這些缺乏新穎、實用、共享的服務(wù)方式造成該行業(yè)維護管理費用高、服務(wù)偏離、效益下滑、經(jīng)營管理困難,也進而阻礙全國統(tǒng)一聯(lián)網(wǎng)的實施。

  同樣互聯(lián)網(wǎng)運營商和ICP服務(wù)者因為缺乏實用的信息服務(wù)內(nèi)容和有效的運營、盈利模式,導(dǎo)致經(jīng)營困難,語音互聯(lián)將改變他們的運營模式。移動電話運營商的數(shù)據(jù)業(yè)務(wù)和語音互聯(lián)業(yè)務(wù)也將成為新的增長點。

  基于VoiceXML標(biāo)準(zhǔn)的語音數(shù)據(jù)互聯(lián)將為聲訊網(wǎng)、移動網(wǎng)、互聯(lián)網(wǎng)的統(tǒng)一提供技術(shù)保障。該業(yè)務(wù)將使得人們利用普遍存在的電話以自然語音交互的方式方便簡單地進行互聯(lián)網(wǎng)上的商務(wù)活動,解決了真正的移動和方便。移動和方便可以吸引更多的用戶群,但更重要的還是服務(wù)和內(nèi)容,如何提供更實用、更及時、更有效的信息是互聯(lián)網(wǎng)包括語音互聯(lián)在內(nèi)發(fā)展的關(guān)鍵。

  只有統(tǒng)一平臺標(biāo)準(zhǔn)規(guī)范,實現(xiàn)全網(wǎng)平臺內(nèi)容接口的統(tǒng)一,并利用電話計費代收的機制,實現(xiàn)ICP收費模式、服務(wù)內(nèi)容發(fā)布、運營管理、系統(tǒng)維護等的統(tǒng)一和價值鏈的平衡,才能在互惠、良性循環(huán)的產(chǎn)業(yè)鏈中互相促進,共同發(fā)展。

  基于VoiceXML的統(tǒng)一業(yè)務(wù)腳本、簡單開放的業(yè)務(wù)發(fā)布機制、完善的計費代收費體系、統(tǒng)一的平臺接口、不同網(wǎng)絡(luò)的統(tǒng)一構(gòu)成了中國又一幕網(wǎng)絡(luò)應(yīng)用的宏觀景象。

語音門戶和語音互聯(lián)業(yè)務(wù)

  IDG預(yù)測,到2002年,全世界將有5萬個提供語音服務(wù)業(yè)務(wù)的網(wǎng)站;KESLEY GROUP預(yù)測,到2005年,將有1.28億的語音互聯(lián)用戶,語音服務(wù)年收入將達到123億美元;截止到2001年10月,AT&T、AOL、NTT DOCOMO、TELL ME、臺灣和訊電信、YAHOO等相繼發(fā)布了語音互聯(lián)服務(wù);語音互聯(lián)網(wǎng)正在國際上迅速成為與SMS、I-Mode并列的三個電信新業(yè)務(wù)。

  語音應(yīng)用必須注重個性化的服務(wù),強調(diào)信息的精煉和時效,做到用戶的細分,避免煩冗和大眾化。

中國語音互聯(lián)產(chǎn)業(yè)鏈

  共贏的開放合作機制、相互依存發(fā)展的良性平衡鏈:

  系統(tǒng)提供商:提供系統(tǒng)技術(shù)、發(fā)布系統(tǒng)培訓(xùn),為ICP、ISP/ASP提供支持,共同服務(wù)于用戶。

  Voice ISP/ASP:提供接入、管理、計費、清算、應(yīng)用等支持服務(wù)。

  Voice ICP:在發(fā)布體系下提供用戶滿意的優(yōu)質(zhì)內(nèi)容,借助代收費、清算機制改變收費模式和盈利模式。

  Voice 用戶:享受完美服務(wù),提供服務(wù)反饋供改善系統(tǒng)及服務(wù)。

語音互聯(lián)與傳統(tǒng)聲訊的本質(zhì)區(qū)別

  不統(tǒng)一的局域網(wǎng)(聲迅)與統(tǒng)一協(xié)議的互聯(lián)網(wǎng)(語音互聯(lián))

統(tǒng)一的業(yè)務(wù)發(fā)布、維護管理體系促進業(yè)務(wù)的豐富和ICP的發(fā)展

  有了統(tǒng)一、互聯(lián)的業(yè)務(wù)腳本以及合作的計費清算、代收費機制,可以改變ICP的盈利模式,但還必須有統(tǒng)一、開放、方便的發(fā)布管理體系才能方便眾多的ICP的合作參與,保證服務(wù)內(nèi)容的豐富和優(yōu)化。

  1、WEB腳本的業(yè)務(wù)內(nèi)容:系統(tǒng)采用VoiceXML標(biāo)準(zhǔn)的語言進行業(yè)務(wù)流程和數(shù)據(jù)的腳本生成管理。該腳本做到語音和數(shù)據(jù)在WEB的融合,滿足電話、PC等不同終端的語音命令交互訪問。方便、簡單、統(tǒng)一的業(yè)務(wù)腳本,保證內(nèi)容的豐富、更新和優(yōu)化。

  2、統(tǒng)一業(yè)務(wù)發(fā)布體系:系統(tǒng)提供簡單、一致的業(yè)務(wù)發(fā)布和管理接口規(guī)范(如同網(wǎng)頁發(fā)布一樣),并建立業(yè)務(wù)目錄庫進行業(yè)務(wù)的導(dǎo)航搜索。該體系方便了系統(tǒng)運營者和第三方業(yè)務(wù)合作者如ICP的業(yè)務(wù)發(fā)布和管理,也方便了業(yè)務(wù)訪問者的交互,為系統(tǒng)平臺的出租、外包合作和業(yè)務(wù)內(nèi)容的豐富提供保障。對于平臺全國聯(lián)網(wǎng)實施后,無論任何平臺、中心或各地市,只需要在WEB上發(fā)布相關(guān)的業(yè)務(wù)腳本,系統(tǒng)自動生成目錄信息庫就可以完成不同地市業(yè)務(wù)的共享。

  3、在線發(fā)布調(diào)試、維護管理:系統(tǒng)提供在線調(diào)試、維護、管理功能,用戶可以在正式發(fā)布之前進行業(yè)務(wù)的試運行、調(diào)試、修改,直至滿足要求后在正式發(fā)布。整個過程不影響平臺的正常運營。

  4、完善的業(yè)務(wù)統(tǒng)計、分析、決策鏈:平臺完善的統(tǒng)計管理系統(tǒng)為信息/業(yè)務(wù)的運營、決策提供依據(jù),結(jié)合客戶關(guān)系管理和呼叫中心的業(yè)務(wù)統(tǒng)計分析功能,提供閉環(huán)的、智能的信息優(yōu)化決策鏈。充分考慮系統(tǒng)平臺的客戶價值(Customer Economy)。這些功能為平臺的運營、管理者提供全網(wǎng)的業(yè)務(wù)運營信息,便于全網(wǎng)業(yè)務(wù)的監(jiān)督、管理、控制。

  5、全網(wǎng)系統(tǒng)管理:系統(tǒng)提供安全可靠的系統(tǒng)網(wǎng)絡(luò)管理、業(yè)務(wù)管理、安全認(rèn)證、計費結(jié)算等等相關(guān)的功能。保證網(wǎng)絡(luò)的后臺支持。

中國語音互聯(lián)網(wǎng)的統(tǒng)一規(guī)范VAP標(biāo)準(zhǔn)

  語音互聯(lián)網(wǎng)應(yīng)用技術(shù)標(biāo)準(zhǔn)VAP(Voice Application Protocol)及產(chǎn)品,是指在互聯(lián)網(wǎng)絡(luò)和通信網(wǎng)絡(luò)進行自然語音交互技術(shù)應(yīng)用開發(fā)、服務(wù)提供的技術(shù)標(biāo)準(zhǔn)及相應(yīng)設(shè)備的產(chǎn)品規(guī)范;ヂ(lián)網(wǎng)語音應(yīng)用技術(shù)標(biāo)準(zhǔn)及產(chǎn)品制定了語音應(yīng)用的架構(gòu)和網(wǎng)絡(luò)協(xié)議,詳細說明語音終端設(shè)備(如電話、手機、內(nèi)嵌語音瀏覽器的智能設(shè)備、PC等)與網(wǎng)絡(luò)的通信協(xié)議和技術(shù)規(guī)范。該協(xié)議擴展和協(xié)調(diào)了通信網(wǎng)絡(luò)技術(shù)(如網(wǎng)絡(luò)數(shù)字通信標(biāo)準(zhǔn))和Internet技術(shù)(如XML、Web以及多種的信息內(nèi)容格式等)。該協(xié)議可以幫助網(wǎng)絡(luò)的運營商、設(shè)備廠商、應(yīng)用開發(fā)商等建立基于語音方式的靈活、快捷、高效的服務(wù)。

  中國移動互聯(lián)應(yīng)用協(xié)議特別組的中文&漢語專家組對互聯(lián)網(wǎng)語音應(yīng)用技術(shù)標(biāo)準(zhǔn)及產(chǎn)品從多個層次進行定義:應(yīng)用層、會話層、事務(wù)層、安全層、控制層、信號層。形成中國語音互聯(lián)應(yīng)用的規(guī)范標(biāo)準(zhǔn)VAP。

  互聯(lián)網(wǎng)語音應(yīng)用技術(shù)標(biāo)準(zhǔn)及產(chǎn)品不僅僅為實現(xiàn)語音應(yīng)用技術(shù)而設(shè)計,它的設(shè)計中使語音技術(shù)可以操作多種不同的應(yīng)用,如短消息、WAP等。其在每個層次上都提供擴展性的已定義好的接口,使其不僅僅限制于互聯(lián)網(wǎng)語音應(yīng)用技術(shù)標(biāo)準(zhǔn)及產(chǎn)品(VAP)所描述和定義的范圍內(nèi)。

VoiceXML、VAP和電子商務(wù)技術(shù)促進電話語音商務(wù)的應(yīng)用

  語音資訊將是信息發(fā)展的又一場信息革命。從MIS、ERP、CTI、CRM等到工作流、范稱的管理系統(tǒng)等電子商務(wù)活動(我們統(tǒng)一提升到‘商務(wù)’的高度來認(rèn)識)將無不用到語音技術(shù),即語音技術(shù)是商務(wù)系統(tǒng)的基本‘部件’。電話最普及、最方便,技術(shù)的發(fā)展使電話信息交互更加友好。配合多種終端設(shè)備,幾乎所有信息(我們統(tǒng)一提升到‘知識’的高度認(rèn)識)都可處理。借助VoiceXML技術(shù)和語音應(yīng)用標(biāo)準(zhǔn)規(guī)范,將更方便用戶的語音交互操作和語音商務(wù)(V-Commerce)應(yīng)用系統(tǒng)的建立。

共同聯(lián)合推動我國民族科技發(fā)展

  良性發(fā)展的產(chǎn)業(yè)鏈,統(tǒng)一開放的標(biāo)準(zhǔn),為各行業(yè)的合作提供空間。經(jīng)濟的發(fā)展必須依靠獨立自主的技術(shù),各大運營商、ICP、系統(tǒng)提供商等等應(yīng)共同參與,積極聯(lián)合,形成互惠統(tǒng)一的國家利益體,努力推動我國技術(shù)的發(fā)展和經(jīng)濟的繁榮。

參考資源:

www.w3c.org/voice

m.estzdh.com

www.6637.com

m.estzdh.com/technology/voiceXML/voiceXML.htm

作者簡介:

雷百鎖: 無限商機技術(shù)有限公司產(chǎn)品總監(jiān)
E-mail: leibs@yeah.net

無限商機供稿 CTI論壇編輯



相關(guān)鏈接:
融合通訊還有多遠? 2003-04-15
北京無限商機 2002-03-04
北郵UBO共建實驗室致力語音數(shù)據(jù)兩網(wǎng)融合 2002-01-23
企業(yè)服務(wù)新形象——UBO Tel-win智能總機 2001-12-20
叩“天”問“贏”TEL-win 2001-11-26

分類信息:     技術(shù)_voicexml_文摘