語(yǔ)音合成基于DSP
——東進(jìn)基于DSP的TTS語(yǔ)音卡
2001/08/30
在各種 CTI應(yīng)用系統(tǒng)中,電腦語(yǔ)音板卡是一塊基石,板卡性能是否穩(wěn)定、單機(jī)板功能集成高低且采用微處理器與否,直接影響到整個(gè)應(yīng)用系統(tǒng)的穩(wěn)定性。DSP是近年來(lái)廣泛應(yīng)用于通信行業(yè)的新技術(shù),自DSP技術(shù)應(yīng)用到電腦語(yǔ)音板卡后,大大增強(qiáng)了板卡的功能,也為集成新技術(shù)和新功能奠定了基礎(chǔ)。
TTS作為CTI的一項(xiàng)核心技術(shù),就是利用DSP技術(shù)集成到語(yǔ)音卡上的。
在目前的CTI應(yīng)用中,自動(dòng)語(yǔ)音應(yīng)答系統(tǒng)的放音大多采用錄音——簡(jiǎn)單拼接——重放的方法。
而中文語(yǔ)音合成技術(shù)(TTS),是基于語(yǔ)音數(shù)據(jù)庫(kù)技術(shù),采用語(yǔ)音基元拼接的方法進(jìn)行語(yǔ)音合成。采用這種技術(shù)的漢語(yǔ)文語(yǔ)轉(zhuǎn)換系統(tǒng),通過(guò)隱馬可夫模型法等算法進(jìn)行文本分析,依據(jù)漢語(yǔ)韻律的變化建立多樣本的語(yǔ)音基元數(shù)據(jù)庫(kù),并采用恰當(dāng)技術(shù)挑選所需語(yǔ)音單元拼接起來(lái),生成高自然度的語(yǔ)句。由于語(yǔ)音基元樣本截取于自然語(yǔ)音波形,所以合成的語(yǔ)音具有高清晰度和高自然度。而且只要語(yǔ)音數(shù)據(jù)庫(kù)足夠完備,就可以拼接出任何語(yǔ)句。
TTS技術(shù)的應(yīng)用在CTI環(huán)境下的特殊技術(shù)要求包括:
◆并發(fā)處理能力要求高。CTI是并發(fā)、隨機(jī)的業(yè)務(wù),要求能夠同時(shí)處理多個(gè)呼叫請(qǐng)求,因此要求同時(shí)多通道TTS放音,支持高密度應(yīng)用。
◆實(shí)時(shí)通信處理。電話通信是實(shí)時(shí)通信,要求TTS的時(shí)延控制在很小的范圍內(nèi)(低于0.1秒),否則可能造成接續(xù)不夠連貫。
◆開(kāi)放性環(huán)境是大勢(shì)所趨。通信業(yè)務(wù)在逐步開(kāi)放,TTS需要具備二次開(kāi)發(fā)接口性能才可以集成在CTI、智能網(wǎng)等業(yè)務(wù)中。
◆靈活擴(kuò)展性。隨著業(yè)務(wù)規(guī)模擴(kuò)展,TTS 能夠隨著CTI系統(tǒng)擴(kuò)容而靈活擴(kuò)展,最大限度保護(hù)既有投資。
◆版本方便升級(jí)。當(dāng)TTS產(chǎn)品的技術(shù)性能得到進(jìn)一步提升時(shí),在不增加任何硬件的情況下可以通過(guò)軟件更新實(shí)現(xiàn)版本的升級(jí)。
為滿足這些要求,很多供應(yīng)商提出了技術(shù)方案,語(yǔ)音卡供應(yīng)商Dialogic和深圳東進(jìn)分別提出了自己的解決方案——基于DSP技術(shù)的TTS語(yǔ)音卡。
基于DSP的TTS語(yǔ)音卡解決方案充分考慮通信網(wǎng)環(huán)境,特別是電話通信的環(huán)境,很好滿足了CTI系統(tǒng)的技術(shù)需求。
東進(jìn)(http://www.dj.com.cn)的解決方案是在一塊語(yǔ)音板卡同時(shí)集成32線TTS合成和16線電話呼叫處理能力。其D160A-TTS語(yǔ)音卡,采用DSP芯片、內(nèi)置TTS技術(shù)、內(nèi)置32方會(huì)議、單卡提供16通道的電話語(yǔ)音處理功能的模擬語(yǔ)音卡,在卡內(nèi)程序中嵌入了TTS 系統(tǒng)的接口,支持中文WindowsNT平臺(tái)和中文語(yǔ)音合成。
下面以深圳東進(jìn)的D160A-TTS產(chǎn)品為例簡(jiǎn)單介紹TTS語(yǔ)音卡的應(yīng)用。在數(shù)字中繼線路上(ISDN-PRI信令,1號(hào)信令,7號(hào)信令)的硬件構(gòu)成如右圖。
TTS方面的操作是在D160A-TTS的DSP基礎(chǔ)上實(shí)現(xiàn)的,而通過(guò)E1線路和電信網(wǎng)絡(luò)接口的處理、信令處理、交換、接續(xù)控制等,都是由D320/640 E1實(shí)現(xiàn)的,調(diào)用的是數(shù)字中繼卡的API函數(shù)。
單獨(dú)的一塊D160A-TTS卡上面除了支持TTS的功能之外,還可以處理呼叫控制、信號(hào)產(chǎn)生、DTMF收發(fā)、電話會(huì)議、A/D轉(zhuǎn)換、D/A轉(zhuǎn)換等。
D160A-TTS數(shù)字中繼線路上的硬件構(gòu)成圖
從軟件結(jié)構(gòu)上面來(lái)看,基于DSP的TTS技術(shù)具有模塊化、開(kāi)放性、可升級(jí)性等特點(diǎn)。軟件模塊的組成如下:
TTS API(TTS編程接口)是面向開(kāi)發(fā)商提供的接口,對(duì)于沒(méi)有TTS技術(shù)背景的開(kāi)發(fā)人員來(lái)說(shuō),使用TTS API也可以開(kāi)發(fā)出完整的TTS程序。
D160A-TTS軟件模塊組成圖
TTS語(yǔ)音卡在CTI系統(tǒng)中應(yīng)用非常廣泛,在銀行、政府機(jī)關(guān)、氣象服務(wù)中心、考試中心、公用事業(yè)、114查詢臺(tái)、160/168信息臺(tái)等的IVR交互式語(yǔ)音應(yīng)答系統(tǒng)中都可采用,甚至用在網(wǎng)絡(luò)中,用戶可以通過(guò)普通電話撥入Internet,利用TTS技術(shù)收聽(tīng)網(wǎng)頁(yè)和E-Mail。
中國(guó)計(jì)算機(jī)報(bào) 2001/08/30
東進(jìn)技術(shù)總裁賀建楠談3G應(yīng)用落地:進(jìn)展超出預(yù)期 2009-09-25 |
東進(jìn)技術(shù)喜獲“2009年度優(yōu)秀通信企業(yè)” 2009-09-23 |
東進(jìn)技術(shù)推出新一代數(shù)字交叉鏈接設(shè)備 2009-09-15 |
東進(jìn)技術(shù)助力江蘇昆山城管實(shí)現(xiàn)數(shù)字化 2009-09-02 |
當(dāng)呼叫中心遇到ERP 東進(jìn)技術(shù)助力河北百度 2009-08-26 |