Prosody板卡對SpeechWorks OSR語音識別軟件的支持
2004/06/09
為了繼續(xù)貫徹為用戶提供卓越的價(jià)值和語音處理功能選擇的主旨, Aculab推出了SpeechWorks 開放語音識別引擎(OSR)與Prosody DSP 資源卡的軟件接口。所有格式的Prosody 資源卡都支持此功能,無需新的或額外的硬件就能發(fā)揮Prosody板卡和SpeechWorks識別軟件組合的優(yōu)勢。
這意味著,對于那些尋求使用SpeechWorks OSR來設(shè)計(jì)和實(shí)現(xiàn)電話語音應(yīng)用的開發(fā)商而言, 能同時(shí)獲得Prosody板卡帶來的優(yōu)勢。
SpeechWorks OSR 語音技術(shù)(包括OpenSpeech識別引擎和OpenSpeech對話模塊)與Prosody DSP資源結(jié)合在一起,意味著包括錄音/回放、回波抵消、DTMF信號檢測/產(chǎn)生、傳真和會議等語音處理功能可以和強(qiáng)大的基于主機(jī)的語音識別同時(shí)使用,實(shí)現(xiàn)了多項(xiàng)語音技術(shù)與Prosody平臺的真正綜合集成。
當(dāng)Prosody配備有Aculab數(shù)字網(wǎng)絡(luò)接口模塊時(shí),可以最大限度地接入世界范圍內(nèi)的通信協(xié)議,由此產(chǎn)生的靈活性和豐富的功能可以確保開發(fā)商投資的回報(bào)。
系統(tǒng)易于集成和迅速實(shí)施
自然語言識別任務(wù)是由基于主機(jī)的SpeechWorks語音識別單元(VRU)完成的。Aculab的SpeechWorks話音接口模塊也是在主機(jī)上執(zhí)行的。 此接口模塊和Aculab Prosody板卡交互,支持應(yīng)用系統(tǒng)所需得的語音處理功能以及數(shù)字網(wǎng)絡(luò)接口。
開發(fā)商很容易挖掘SpeechWorks和Prosody平臺組合帶來的強(qiáng)大語音處理能力,來開發(fā)完全意義上的、聲音驅(qū)動的交互式應(yīng)用解決方案。Prosody通過Aculab統(tǒng)一的、跨平臺的API與SpeechWorks緊密結(jié)合起來,能快速實(shí)現(xiàn)項(xiàng)目工程。 SpeechWorks多種語言支持與Aculab的廣泛電信網(wǎng)協(xié)議和國家認(rèn)證結(jié)合在一起時(shí),可從容面對理世界范圍內(nèi)的各種商業(yè)機(jī)會。
高性能
SpeechWorks的OSR在容錯(cuò)PC或VRU上運(yùn)行,構(gòu)成了具有 "N+1"結(jié)構(gòu)的應(yīng)用環(huán)境, 以便100%支持每個(gè)用戶呼叫都能得到相應(yīng)的通道處理資源。使用Prosody能促使高性能應(yīng)用方案的開發(fā)按更經(jīng)濟(jì)節(jié)省的方式進(jìn)行。例如,SpeechWorks OSR應(yīng)用能與Aculab Prosody板卡結(jié)合,并從并發(fā)的多個(gè)呼叫中獲取話音信號輸入。換言之,Prosody用來采集話音信號,然后饋送到SpeechWorks' OSR SMART識別器進(jìn)行多通道語音識別。當(dāng)"Barge-in"功能激活并支持回波抵消時(shí),單個(gè)Prosody DSP模塊能使系統(tǒng)同時(shí)向24個(gè)呼叫用戶播放語音提示,并識別來自這些呼叫者的話音響應(yīng)。完全配置的Prosody板卡可以支撐四個(gè)DSP模塊,所以一塊Prosody板卡的總體語音識別通道容量指標(biāo)是相當(dāng)令人信服的。
該語音接口模塊對通道容量未加明確限制,事實(shí)上,通道容量還取決于實(shí)際應(yīng)用中的一些典型因素,如:
·VRU系統(tǒng)處理能力
·運(yùn)行Speechworks的主機(jī)PC負(fù)荷
·Prosody網(wǎng)絡(luò)接口數(shù)量
·Prosody DSP資源
Aculab的SpeechWorks語音接口模塊支持Windows 2000操作系統(tǒng)。若有其它要求,請聯(lián)系我們。
關(guān)于SpeechWorks
SpeechWorks的OpenSpeech是一種為VoiceXML優(yōu)化的、開放的和高性能的語音識別引擎。 該識別器采用的是獲獎的專利技術(shù),能為那些希望把語音識別應(yīng)用業(yè)務(wù)帶入市場的平臺開發(fā)商、應(yīng)用供應(yīng)商和電信運(yùn)營商帶來明顯的競爭優(yōu)勢,包括:
·開放且基于標(biāo)準(zhǔn)的結(jié)構(gòu)
·支持語音行業(yè)標(biāo)準(zhǔn)VoiceXML
·高性能和準(zhǔn)確性,尤其在無線應(yīng)用環(huán)境中
若選擇OpenSpeech識別器, 開發(fā)商還能進(jìn)一步利用SpeechWorks的其它基于VoiceXML的產(chǎn)品的優(yōu)勢, 包括OpenSpeech對話模塊和OpenSpeech工具。
與以前的SpeechWorks 軟件版本相比,除了支持行業(yè)標(biāo)準(zhǔn), OpenSpeech識別器還在無線通信、準(zhǔn)確性、可擴(kuò)展性、語法管理和適應(yīng)能力等方面的性能有明顯提高。此外, 由于與AT&T的有限狀態(tài)轉(zhuǎn)換器(FST)集成,OpenSpeech識別器能識別多達(dá)一百萬個(gè)單詞, 遠(yuǎn)高于行業(yè)標(biāo)準(zhǔn)的8-10萬。新的端點(diǎn)檢測技術(shù)是專門為提高無線環(huán)境中的識別準(zhǔn)確性而設(shè)計(jì)的。
支持多種語言
開發(fā)商能建立一個(gè)應(yīng)用系統(tǒng),采用一個(gè)業(yè)務(wù)電話號碼,同時(shí)支持多種語言,既節(jié)省開發(fā)時(shí)間,又減少平臺和電話費(fèi)用。目前,SpeechWorks對下列語言提供全方位支持,包括:法語(歐洲和加拿大),西班牙語(拉丁美洲),廣東話(香港),普通話(臺灣),德語,英語(英國,美國,澳大利亞,亞洲和南非等),韓國語,日語和葡萄牙語(巴西)。
Aculab公司供稿 CTI論壇編輯
相關(guān)鏈接: