VoiceXML 2.0是一種標(biāo)記語(yǔ)言,用來(lái)構(gòu)建語(yǔ)音界面——有語(yǔ)音的 HTML。語(yǔ)音瀏覽器類似 Web 瀏覽器,它通過(guò)解釋VoiceXML 2.0腳本來(lái)向用戶提供語(yǔ)音信息并接受用戶的語(yǔ)音請(qǐng)求。
萬(wàn)維網(wǎng)聯(lián)盟(W3C,World Wide Web Consortium)全力推薦使用VoiceXML 2.0,它通常被理解為一種Web標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)添加了語(yǔ)音識(shí)別語(yǔ)法格式,用來(lái)識(shí)別用戶可能就提示回答的字詞,上一版本沒有這一功能。
為了更好地理解VoiceXML 2.0,可以將VoiceXML和HTML進(jìn)行類比。采用HTML的Web應(yīng)用可以分為兩部分:瀏覽器和Web服務(wù)器。相應(yīng)地,VoiceXML涉及的組件也可分為語(yǔ)音瀏覽器和相當(dāng)于Web服務(wù)器功能的應(yīng)用服務(wù)器。
由于電話(包括很多蜂窩電話)沒有計(jì)算功能,無(wú)法管理語(yǔ)音瀏覽器,所以語(yǔ)音瀏覽器駐留在網(wǎng)絡(luò)上的語(yǔ)音服務(wù)器中。語(yǔ)音服務(wù)器可以位于企業(yè)數(shù)據(jù)中心,或者位于主管供應(yīng)商處。用戶撥叫一臺(tái)語(yǔ)音服務(wù)器,該服務(wù)器從一臺(tái)應(yīng)用服務(wù)器上下載VoiceXML 2.0腳本、語(yǔ)法格式和聲音文件。語(yǔ)音瀏覽器以一種語(yǔ)音信息的形式將VoiceXML 2.0腳本翻譯給用戶聽,語(yǔ)音信息可以是預(yù)先錄制的語(yǔ)音,或經(jīng)由一個(gè)文本語(yǔ)音合成器產(chǎn)生的文本。然后語(yǔ)音瀏覽器調(diào)用一個(gè)自動(dòng)語(yǔ)音識(shí)別(ASR)軟件,使用語(yǔ)法格式來(lái)識(shí)別出用戶響應(yīng)的語(yǔ)音詞匯。
下面我們來(lái)看一個(gè)具體的例子:
系統(tǒng):“歡迎致電小李。請(qǐng)問您想接通銷售部門、會(huì)計(jì)部門還是維護(hù)部門?”
用戶:“維護(hù)部門。”
ASR 將識(shí)別用戶的語(yǔ)音回復(fù)。在上面這個(gè)例子中,語(yǔ)法格式只包括三個(gè)詞:“銷售部門”、“會(huì)計(jì)部門”和“維護(hù)部門”。由于ASR的語(yǔ)法格式僅由有限數(shù)量的單詞組成,這種語(yǔ)法驅(qū)動(dòng)的ASR比起聽寫式ASR執(zhí)行更為精確。聽寫式ASR則是試圖識(shí)別用戶說(shuō)出的大多數(shù)英語(yǔ)或其他語(yǔ)言的單詞。
開發(fā)人員使用VoiceXML 2.0來(lái)為多種應(yīng)用程序和信息(包括有時(shí)效性的數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)和個(gè)人信息)提供電話用戶界面。有了這些應(yīng)用程序,用戶只需要從任意電話撥入,表明身份并請(qǐng)求所需的信息,就可以隨時(shí)隨地訪問企業(yè)數(shù)據(jù)?蛻暨可以使用這些系統(tǒng)來(lái)訪問訂單狀態(tài);以及目錄、交付和賬戶信息。
有許多交互式語(yǔ)音應(yīng)用程序可以讓用戶通過(guò)按鍵式電話與計(jì)算機(jī)交流。但是,通常呼叫者需要瀏覽的菜單很長(zhǎng),而且很花時(shí)間。同時(shí),讓呼叫者一邊聽電話,一邊在蜂窩電話的小型鍵盤上搜索并且按鈕要按得正確,是很困難的事情。因此用戶需要IVR用戶界面來(lái)與計(jì)算機(jī)交流。
VoiceXML 2.0是一種標(biāo)記語(yǔ)言,用來(lái)構(gòu)建語(yǔ)音界面——有語(yǔ)音的 HTML。語(yǔ)音瀏覽器類似 Web 瀏覽器,它通過(guò)解釋VoiceXML 2.0腳本來(lái)向用戶提供語(yǔ)音信息并接受用戶的語(yǔ)音請(qǐng)求。
萬(wàn)維網(wǎng)聯(lián)盟(W3C,World Wide Web Consortium)全力推薦使用VoiceXML 2.0,它通常被理解為一種Web標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)添加了語(yǔ)音識(shí)別語(yǔ)法格式,用來(lái)識(shí)別用戶可能就提示回答的字詞,上一版本沒有這一功能。
為了更好地理解VoiceXML 2.0,可以將VoiceXML和HTML進(jìn)行類比。采用HTML的Web應(yīng)用可以分為兩部分:瀏覽器和Web服務(wù)器。相應(yīng)地,VoiceXML涉及的組件也可分為語(yǔ)音瀏覽器和相當(dāng)于Web服務(wù)器功能的應(yīng)用服務(wù)器。
由于電話(包括很多蜂窩電話)沒有計(jì)算功能,無(wú)法管理語(yǔ)音瀏覽器,所以語(yǔ)音瀏覽器駐留在網(wǎng)絡(luò)上的語(yǔ)音服務(wù)器中。語(yǔ)音服務(wù)器可以位于企業(yè)數(shù)據(jù)中心,或者位于主管供應(yīng)商處。用戶撥叫一臺(tái)語(yǔ)音服務(wù)器,該服務(wù)器從一臺(tái)應(yīng)用服務(wù)器上下載VoiceXML 2.0腳本、語(yǔ)法格式和聲音文件。語(yǔ)音瀏覽器以一種語(yǔ)音信息的形式將VoiceXML 2.0腳本翻譯給用戶聽,語(yǔ)音信息可以是預(yù)先錄制的語(yǔ)音,或經(jīng)由一個(gè)文本語(yǔ)音合成器產(chǎn)生的文本。然后語(yǔ)音瀏覽器調(diào)用一個(gè)自動(dòng)語(yǔ)音識(shí)別(ASR)軟件,使用語(yǔ)法格式來(lái)識(shí)別出用戶響應(yīng)的語(yǔ)音詞匯。
下面我們來(lái)看一個(gè)具體的例子:
系統(tǒng):“歡迎致電小李。請(qǐng)問您想接通銷售部門、會(huì)計(jì)部門還是維護(hù)部門?”
用戶:“維護(hù)部門!
ASR 將識(shí)別用戶的語(yǔ)音回復(fù)。在上面這個(gè)例子中,語(yǔ)法格式只包括三個(gè)詞:“銷售部門”、“會(huì)計(jì)部門”和“維護(hù)部門”。由于ASR的語(yǔ)法格式僅由有限數(shù)量的單詞組成,這種語(yǔ)法驅(qū)動(dòng)的ASR比起聽寫式ASR執(zhí)行更為精確。聽寫式ASR則是試圖識(shí)別用戶說(shuō)出的大多數(shù)英語(yǔ)或其他語(yǔ)言的單詞。
開發(fā)人員使用VoiceXML 2.0來(lái)為多種應(yīng)用程序和信息(包括有時(shí)效性的數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)和個(gè)人信息)提供電話用戶界面。有了這些應(yīng)用程序,用戶只需要從任意電話撥入,表明身份并請(qǐng)求所需的信息,就可以隨時(shí)隨地訪問企業(yè)數(shù)據(jù)?蛻暨可以使用這些系統(tǒng)來(lái)訪問訂單狀態(tài);以及目錄、交付和賬戶信息。
VoiceXML組件