評論:語音識別適合網(wǎng)絡(luò)應(yīng)用
Bill Pechey 2006/10/24
微軟的語音識別技術(shù)以及對揚聲器獨立的語音識別軟件的出現(xiàn),讓我們開始關(guān)注語音識別技術(shù)的發(fā)展和應(yīng)用。
IT行業(yè)有時候看起來就好像是城市中的公交車,可能很多年都沒有變,但是突然出現(xiàn)了大量的改變。最近,Nuance公布了它最新版的語音識別軟件Dragon Naturally Speaking 9,而微軟也在經(jīng)歷過一次慘痛的失敗后,在SpeechTEK大會上重新推出了他令人印象深刻的語音技術(shù)產(chǎn)品。
我曾經(jīng)用過這兩個語音識別軟件的前一個版本,客觀地說,如果使用高質(zhì)量的麥克風,它們都有很好的表現(xiàn)。雖然我還沒有用過Dragon 9,但是據(jù)用過的人說,它比以前的版本有了很大的進步。除了精確度有所提高外,它也是第一個具有獨立揚聲器模式的語音識別軟件。如果這一功能真的有效,那么將為語音識別技術(shù)打開一個廣闊的應(yīng)用空間。
我一直認為對著電腦說話是應(yīng)該被避免的,不過微軟看上去好像并不認同,從他在Windows Vista中加入語音識別技術(shù)就可以看出。而且我認為當Windows Vista大面積發(fā)行后,微軟將更加公開推動語音識別技術(shù),但愿這不會導(dǎo)致像在公車上大聲講電話這種不文明行為的泛濫。
目前各界對于語音識別技術(shù)的研究熱情令我有些驚訝,很多大型企業(yè)都有這方面的專業(yè)研究團隊,各大院校的有關(guān)研究也很多。如果不是要對著電腦說話,如此大規(guī)模的研究又是為了什么?也許答案是網(wǎng)絡(luò)應(yīng)用。
歐洲電信標準協(xié)會(Etsi)有一個叫做Aurora的項目,即開發(fā)一套在移動網(wǎng)絡(luò)上的分布式語音識別應(yīng)用標準。該標準規(guī)定,部分語音識別引擎工作在移動終端設(shè)備上,并將語音傳輸給識別中心。我對這種應(yīng)用的接受程度比前面所說的要大,畢竟對著手機說話要比對著筆記本說話容易被人接受。
Etsi表示,語音識別的其中一項應(yīng)用是用戶在路上對著電話講述會議內(nèi)容,然后將這些內(nèi)容通過郵件發(fā)送給自己,以便在回到辦公室或回到住所之后再對會議內(nèi)容進行進一步編輯。這聽上去挺不錯的,用戶不會再去考慮其它一些網(wǎng)絡(luò)服務(wù)商所提供的類似收費服務(wù)了。
正如目前流行的SpinVox 服務(wù)所展示的,用戶在收到語音信箱的留言后,不是聽到錄音,而是看到留言的文字內(nèi)容。一個中央語音識別系統(tǒng)可以讓企業(yè)網(wǎng)絡(luò)也具有類似的功能,由于微軟的Office Communications Server 2007 內(nèi)置了語音識別技術(shù),因此也許這會是企業(yè)的一個不錯的選擇。
比爾。蓋茨說,語音識別技術(shù)將成為未來十年的一個主流技術(shù),這一點我也認可,但是這種技術(shù)在網(wǎng)絡(luò)應(yīng)用中的規(guī)模也許比在獨立PC應(yīng)用上的規(guī)模更大。無論如何,企業(yè)現(xiàn)在也應(yīng)該開始考慮一下,語音識別技術(shù)到底是不是會對自己的系統(tǒng)效率有提高作用。
CNET科技資訊網(wǎng)(www.cnetnews.com.cn)
相關(guān)鏈接: