首頁>>>技術>>>語音應用>>>語音識別(ASR)  語音識別產(chǎn)品

新型計算機語音識別功能接近大腦

2004/12/24

  俄羅斯科學院無線電與電子技術研究所科研人員安齊佩羅夫開發(fā)出一種全新的計算機語音識別系統(tǒng)。通過實驗發(fā)現(xiàn),語音頻譜中最基本的成分接近1千赫。

  安齊佩羅夫指出,理論上最智能的語音識別系統(tǒng)應該像人的大腦一樣,能在瞬間從大量聲音中分辨出已知的聲音,而不依賴聲音的大小和聲調(diào)。目前的計算機識別系統(tǒng)還沒有達到這種水平。每種聲音對機器識別系統(tǒng)來說,仍是獨一無二的,因此需要在機器上進行訓練。由于長期訓練的結果,在計算機的存儲系統(tǒng)中形成了一個信息庫,將某種聲音的大量方案存儲到這里,當計算機遇到某種聲音時,就在這個信息庫里進行挑選加工,然后選出某種可能的方案。

  安齊佩羅夫在解釋自己開發(fā)的語音識別系統(tǒng)時指出,這一獨特的語音識別系統(tǒng)最主要的是考慮了語音的分級體系,從中辨別語音中最基本的成分,就像鑒別音樂中的音調(diào)一樣,在寬廣的語音頻譜中,分辨出語音中最基本的具有思維性質(zhì)的聲音頻譜。實驗表明,這個頻譜的范圍接近1千赫,而其他那些帶有情感色彩的語調(diào),屬于心理物理學范疇。

  安齊佩羅夫進一步介紹說,在上述理論指導下,他開發(fā)的計算機語音識別系統(tǒng)接近大腦的識別功能:計算機在系統(tǒng)程序的指導下,將語音背景的個性成分清除,保留語音中最基本的成分,最大可能地簡化了計算機的工作。在實驗中,科研人員讓十幾人用不同聲音進行實驗,結果發(fā)現(xiàn),計算機能夠避開那些帶有情感色彩的語調(diào)的干擾,準確地通過語音中最基本的成分辨別聲音,1000比特的內(nèi)存就能識別所有的數(shù)字和一些簡單的語音

  有關專家指出,該識別體系不僅達到了快速辨別語音的能力,還使計算機的存儲時間和內(nèi)存降低。該科研成果最適合大量的移動電子裝置領域。

科技日報



相關鏈接:
得意公司成功舉辦技術培訓并發(fā)布軟件新版本 2004-12-24
中科信利在電信級語音識別產(chǎn)業(yè)化方面取得突破性進展 2004-12-16
科勝通EnsemblePro與言豐文語轉(zhuǎn)換引擎集成測試獲得成功 2004-12-15
短信和菜單用語音表示盲人使用手機不再有困難 2004-12-14
北京捷通華聲成為Eicon技術合作伙伴(ETP) 2004-12-13

分類信息:  國外動態(tài)_與_語音合成TTS  國外動態(tài)_與_語音識別ASR  語音合成TTS_與_語音識別ASR