中科信利在電信級語音識別產(chǎn)業(yè)化方面取得突破性進(jìn)展
2004/12/16
電信級語音識別引擎產(chǎn)品由于其技術(shù)起點(diǎn)高,在面向應(yīng)用時需要解決的技術(shù)難點(diǎn)比較多,國內(nèi)的語音識別廠商一直難以實(shí)現(xiàn)真正產(chǎn)業(yè)化的突破,該領(lǐng)域一直被國外廠商所壟斷。2004年,通過對自身技術(shù)的不斷完善,以及與電信級系統(tǒng)集成商和運(yùn)營商的通力合作,中科信利具有自主知識產(chǎn)權(quán)的分布式電話語音識別引擎已在國內(nèi)多個電信級項目中取得成功應(yīng)用,從而打破了國外廠商對該技術(shù)的壟斷局面, 實(shí)現(xiàn)了國內(nèi)語音識別廠商在產(chǎn)業(yè)化方面質(zhì)的突破。中科信利也正在迅速成為中文領(lǐng)域內(nèi)領(lǐng)先的語音識別軟件供應(yīng)商。
這些成功應(yīng)用的項目包括:北京移動的個人秘書系統(tǒng),成都移動的企業(yè)秘書系統(tǒng)、個人秘書系統(tǒng),重慶聯(lián)通的個人秘書系統(tǒng),河北聯(lián)通的個人秘書系統(tǒng),江蘇電信的個人秘書系統(tǒng),等等。
中科信利分布式語音識別引擎,其核心技術(shù)來源于中科院聲學(xué)研究所中科信利語音實(shí)驗室,該實(shí)驗室具有國際語音識別專家顏永紅研究員領(lǐng)銜的國際一流的研究團(tuán)隊,具備雄厚的研發(fā)實(shí)力,目前在中文語音識別領(lǐng)域業(yè)界領(lǐng)先,贏得了自2003年以來政府組織的各次語音識別技術(shù)比賽。
中科信利公司以實(shí)驗室技術(shù)為基礎(chǔ),致力于開發(fā)實(shí)用的語音引擎產(chǎn)品。同時針對中文特點(diǎn)、應(yīng)用環(huán)境和客戶需求進(jìn)行特別優(yōu)化,可以廣泛適用于有線、無線和VoIP語音環(huán)境,即使在有噪音、背景聲或語音質(zhì)量較差的情況下也能保持較高的識別準(zhǔn)確率。中科信利公司能夠提供業(yè)界獨(dú)樹一幟的方言處理技術(shù)、語音標(biāo)記技術(shù)和個人口音自適應(yīng)技術(shù)。
中科信利公司自主開發(fā)的分布式語音識別引擎,能夠提供語音識別服務(wù)器集群功能,提供具有高識別率、高可靠性、高度靈活的擴(kuò)展性及容錯能力。它使電話用戶通過語音來訪問數(shù)字信息成為可能。電信應(yīng)用增值服務(wù)商和互聯(lián)網(wǎng)應(yīng)用服務(wù)商可以利用中科信利先進(jìn)的語音識別技術(shù)來為其客戶提供更為快捷有效的服務(wù)。
具體來說,中科信利分布式語音識別引擎(TSRE3.0)在市場上的成功應(yīng)用得益于其如下特點(diǎn):
- 高可靠性和穩(wěn)定性
通過精心設(shè)計的客戶端/服務(wù)器架構(gòu),能夠支持成百上千路的語音識別應(yīng)用。資源管理服務(wù)器能夠均勻調(diào)度識別服務(wù)器,達(dá)到負(fù)載均衡,提高系統(tǒng)整體工作效率。當(dāng)識別服務(wù)器發(fā)生故障時,系統(tǒng)能夠自動判別,并將識別任務(wù)轉(zhuǎn)移到其他服務(wù)器。當(dāng)識別任務(wù)量增加時,可以動態(tài)增加服務(wù)器而無須停止原有的識別系統(tǒng)服務(wù)。因而系統(tǒng)具有強(qiáng)大的穩(wěn)定性、容錯能力和可伸縮性,能夠滿足電信級應(yīng)用的需要。
- 具有穩(wěn)健的識別性能
語音模型是基于大量的不同場合,不同人群和不同口音的電話語音數(shù)據(jù)訓(xùn)練出來的,具有較好的環(huán)境適應(yīng)性。通過采用領(lǐng)先的算法模型,TSR3.0識別引擎具有較強(qiáng)的抗噪性能。同時系統(tǒng)還具有較好的拒識功能,能夠拒絕掉大多數(shù)的非語音(如: 敲門聲,咳嗽聲,機(jī)器噪音等等)。
- 具有優(yōu)秀的系統(tǒng)性能
識別引擎占用較小的系統(tǒng)資源,識別速度很快。單臺雙cpu PC服務(wù)器能夠支持90路并發(fā)語音識別,從而可以大大節(jié)省用戶在硬件設(shè)備方面的投資。
- 支持方便快捷的人機(jī)交互
TSR3.0具有BargeIn功能,支持說話者隨時打斷系統(tǒng)提示,從而支持方便快捷的人機(jī)交互。通過對于語音檢測等模塊的精心優(yōu)化,TSR3.0保證了BargeIn條件下仍然保持原有的高識別率。
- 提供說話人自適應(yīng)功能
當(dāng)用戶多次使用同一識別系統(tǒng)時,TSR3.0識別引擎能夠逐步適應(yīng)其口音,使該使用者的識別性能逐步提高。同時,如果預(yù)先給定特定說話人的數(shù)據(jù),系統(tǒng)可以針對特定說話人進(jìn)行自適應(yīng)訓(xùn)練以獲得更加適合其發(fā)音特征的語音模型,從而使得該說話人在使用系統(tǒng)時,性能更好。
同時,這也是國內(nèi)外分布式語音識別引擎產(chǎn)品中唯一提供這項功能的。
- 提供語音注冊功能
TSR3.0允許用戶通過本人語音來向動態(tài)語法增加命令或詞表。這種方式不但能夠有效利用用戶個性化的語音,提高系統(tǒng)的識別準(zhǔn)確率;而且能夠提高用戶輸入詞表的方便性和靈活性。
電話語音識別技術(shù)可以廣泛應(yīng)用于呼叫中心、無線增值服務(wù)、目錄服務(wù)、客服系統(tǒng)、信息查詢系統(tǒng)等各種應(yīng)用領(lǐng)域,可以應(yīng)用于政府、電信、銀行、證券、保險、電力、交通、航空、教育等各個行業(yè)。通過采用基于自然語音交互的模式替代傳統(tǒng)的基于按鍵的交互式語音應(yīng)答(IVR)模式,可以顯著提高客戶使用的方便性、靈活性,為客戶提高更好的服務(wù)。語音識別技術(shù)與門戶網(wǎng)站相結(jié)合,可以開發(fā)出語音門戶,使通過語音方式獲取互聯(lián)網(wǎng)信息成為可能,
從而進(jìn)一步提高應(yīng)用系統(tǒng)的增值性能。
中科信利公司愿與廣大客戶精誠合作,致力于語音識別技術(shù)的推廣和普及,共同創(chuàng)造語音應(yīng)用的美好明天。
中科信利公司供稿 CTI論壇編輯
相關(guān)鏈接: