解決語音門戶
2002/06/17
。。語音合成技術在網(wǎng)站語音門戶中的應用可以提供諸如有聲電子郵件、語音聊天室、電話購物等服務。在不遠的將來,語音門戶系統(tǒng)必將成為一個全能的“翻譯器”,將無窮的互聯(lián)網(wǎng)資源通過電話提供給用戶,為用戶提供全天候、全方位的服務。
語音門戶的核心技術
。。語音門戶要求系統(tǒng)可以進行動態(tài)、海量信息的數(shù)據(jù)查詢以及互聯(lián)網(wǎng)絡上信息的訪問,需使用的核心技術有:
。。語音合成技術(TTS):用以將文本信息轉換為語音信息提供給用戶
。。語音識別技術(ASR):用以取代繁瑣的按鍵輸入,使輸入更為便捷和人性化。
。。VXML技術:用以IVR平臺與互聯(lián)網(wǎng)絡交互信息。(IVR:Interactive Voice Response,交互式語音應答系統(tǒng)。)
。。對于信息服務來說,TTS和ASR的融合意味著兩重含義。其一,由于聲音更加接近人類的語言,改進后的TTS增強了用戶對該技術的認可程度;其二,更加自然的TTS和高質量的語音識別器能讓計算機和人們進行真正意義上的對話,這樣,計算機就能理解對方(人)說的是什么,并且在自己模糊不清的時候,向對方(人)詢問,在交流中明晰客戶的需求。
核心技術描述
。。語音合成技術的本質是將文本信息轉化為語音信息,是實現(xiàn)人機語音通信,建立一個有聽和講能力的口語系統(tǒng)所必需的關鍵技術之一。
。。語音門戶系統(tǒng)是以先進的CTI技術以及開放的Voice XML工業(yè)標準為基礎,架構在ChinaNet網(wǎng)上的ICP;通過電話暢游互聯(lián)網(wǎng),輕松“聽”網(wǎng)上的信息,“說”E-mail,“點擊”網(wǎng)上的鏈接。這是對傳統(tǒng)電話信息服務的一個重大改革;因為接入服務和內容服務的分離,電話信息服務行業(yè)變成了一個開放式的行業(yè),所有傳統(tǒng)的ICP都可以按照Voice XML的標準提供內容服務,而豐富多樣的內容又必然會刺激用戶的增加以及服務需求的增長。由于引入了VXML相關技術,可將平臺的復雜內容屏蔽,無須熟悉底層平臺即可進行高層應用開發(fā);大大地減輕了開發(fā)的難度,縮短開發(fā)周期,降低人力成本。
語音門戶的建設
。。在不影響電信運營商現(xiàn)有平臺的結構和業(yè)務功能的前提下,主要需完成三個功能模塊的系統(tǒng)建設。在動態(tài)信息和海量信息的查詢業(yè)務上,首先必須完成的是對原有的數(shù)字錄音回放方式向TTS平臺的升級;進而在進行了TTS改造的平臺上構建互聯(lián)網(wǎng)上的公共信息查詢服務和個性化信息查詢服務;考慮到實際運用情況,在具體業(yè)務方面建設UMS系統(tǒng),可以基于此業(yè)務提供個人定制信息的服務,滿足人們對于及時性、個性化越來越高的要求。
。。TTS系統(tǒng)、VXML系統(tǒng)、UMS系統(tǒng)與已有IVR(電話語音自動應答系統(tǒng))平臺、Internet、PSTN結合如圖所示。
TTS系統(tǒng)的建設
。。傳統(tǒng)的數(shù)字錄音回放方式需要人工進行錄音,新興的計算機技術“語音合成”,可以運用有限的系統(tǒng)資源將無限的文本信息合成為可聽的語音信息,從而可以改進傳統(tǒng)的錄音回放方式。在不改變現(xiàn)有平臺的基礎上建立的TTS系統(tǒng)可以在信息服務的信息源提供上帶來如下改進:
。。就工作量而言,錄音需要大量的人力,在信息量以級數(shù)增長的今天,錄音往往無法滿足信息的供給,而語音合成將絕大多數(shù)工作由機器代替,人們只需提供現(xiàn)成的文本信息即可輸出聲音信息。
。。對于動態(tài)的信息,尤其是對實時性要求很高的信息如:股票行情等,如果讓錄音員錄音則至少在半小時后才能對外提供,而語音合成可以實現(xiàn)實時的轉換,每分鐘可刷新一次。
。。由于信息的高速增長,錄音數(shù)據(jù)存放和查詢也存在問題。將信息以文本形式存儲在計算機中可節(jié)約大量系統(tǒng)資源再結合計算機技術對數(shù)據(jù)庫中的信息進行搜索和整理將輸出的結果用語音合成轉換成聲音,這樣就可以解決信息服務中海量信息的存儲和查詢的問題。
。。錄音的信息維護、修改的工作量比較大。而文本信息的維護和修改相對要容易得多,通過語音合成技術只需對文本信息進行修改就可以完成信息內容的更改和維護工作。
VXML系統(tǒng)的建設
。。VXML系統(tǒng)的目的就是為了使電話和語音可以應用在互聯(lián)網(wǎng)絡之上,除為消費者服務外,VXML還支持一些商務應用,如話務中心、銀行交易和電子商務。通過VXML技術可以使語音門戶系統(tǒng)訪問到Internet Web上的各種信息,并實現(xiàn)信息的交互。再結合語音合成技術,將文本信息合成為語音信號,用戶就可以通過IVR平臺來訪問Web頁面上的信息了。
。。結合VXML技術,語音系統(tǒng)可以提供更多的個人信息服務:商品交易、金融交易、求職招聘等。相對傳統(tǒng)的同類服務,此類服務與Internet信息共享,更為貼近用戶和可以面對更廣泛的人群。
UMS系統(tǒng)建設
。。統(tǒng)一消息系統(tǒng)(UMS)是一個將各種傳播手段整合的系統(tǒng),結合了各種網(wǎng)絡,用戶可以使用電話、手機、傳真、呼機、數(shù)字移動設備和個人電腦等途徑與系統(tǒng)交互信息。在語音門戶平臺中加入UMS系統(tǒng),將有助于平臺提供更多樣化的服務,與用戶結合更為緊密。
。。UMS 是語音與數(shù)據(jù)融合的產物,一系列的服務提供商可以通過提供UMS服務來擴展自己的業(yè)務范圍。UMS服務可以通過統(tǒng)一平臺來提供給用戶, 也可以由服務提供商將各種信息儲存設備集成起來,通過不同途徑提供給用戶。
。。有聲電子郵件(Voice-Mail)系統(tǒng)就是UMS系統(tǒng)的一個具體應用,它通過電話、手機等通信工具可以向用戶提供Internet上的E-mail服務。因而人們可以不受設備的限制,隨時隨地的收發(fā)電子郵件,即使身處異地,仍然不會錯過E-mail中攜帶的重要商機。
網(wǎng)絡世界
比爾-蓋茨能講中文? 微軟語音技術大"探秘" 2002-05-09 |
語音合成技術: 啟動“第三種引擎” 2002-04-02 |
構建更加人性化的交談式語音應用 2002-03-11 |
回歸到“通天塔”之前 2002-03-11 |
語音合成——燦爛的前景 巨大的商機 2002-01-30 |