語音合成技術開啟后閱讀時代
2008/05/14
正當臺前的明星名人紛紛從臺前走進電腦屏幕背后開博走進事業(yè)第二春的時候,正當我們呼吁給孩子們一個干凈良好的網(wǎng)絡環(huán)境的時候,正當我們?yōu)榫烤拐l才是擁有世界上最眾多網(wǎng)民的國家而暗暗較勁的時候,一個不一樣的時代已經(jīng)悄悄來臨。
語音合成技術,作為智能計算機研究的主導方向和人機智能交互的關鍵技術,一直受到業(yè)界的廣泛關注。據(jù)專家預測,五年內,整個中文語音市場將至少在1000億人民幣以上。面對巨大的國內語音市場,摩托羅拉、IBM、微軟等國際大公司紛紛投入大量的資金進行研發(fā),并推出自己產品。中文語音市場正面臨著國際競爭的巨大壓力。
近日如火如荼的“征集n詞酷宣傳口號 贏取Ipod”的活動,來自一個韓國的在線詞典n詞酷。這個詞典也是開啟后閱讀時代的先鋒。它把語音合成技術與在線詞典結合在一起,將在線詞典的便利性以及功效性提升到最高,開啟了無所不在的試聽時代。如今,我們正在目睹和經(jīng)歷這樣一個時代——后閱讀時代。
事件一 瀏覽網(wǎng)頁不再用“看”
利用語音合成技術讓頁面內容發(fā)音,這可以看做是后閱讀時代的縱向化,這讓閱讀和瀏覽頓時上了一個新的高度。比如一些在線詞典網(wǎng)站,很多網(wǎng)民甚至會把能不能發(fā)音這個功能作為衡量一個詞典網(wǎng)站做的好不好,是否主流的標準;再比如新浪博客的驗證碼收聽功能,瞬間解決了繁瑣而千奇百怪令人生厭的驗證碼輸入問題。但這項技術顯然沒有得到廣泛和應有的應用,只被用于簡短的、自主性較低的信息提取上。
網(wǎng)頁發(fā)聲的最高境界當然是用戶可以隨心所欲地把任何內容轉化為語音信息,但由于系統(tǒng)的斷句提詞做得還不夠好,以至要實現(xiàn)這個愿望還有一定距離。關鍵在于,如何才能解決大段文字的識別與自動發(fā)音。 “n詞酷”,作為第一個吃螃蟹的網(wǎng)站,該網(wǎng)站基本實現(xiàn)了較大段選取網(wǎng)頁內容,中文英文發(fā)音都很地道,斷句技術也做得不錯。而且n詞酷把這項功能作為一個名為“n詞酷小助手”的插件形式,從而實現(xiàn)了跨網(wǎng)站的發(fā)音。眾多用戶將其應用于互聯(lián)網(wǎng)上各種無聲文字資料的學習!
事件二 瀏覽英文網(wǎng)站不再需要“高手”
在我們的印象里,似乎只有社會精英和一些外語高手才放著扎堆的中文網(wǎng)站不去看而去點擊瀏覽一些英文網(wǎng)站。因為語言門檻的存在,網(wǎng)絡并沒有像想象的那樣令世界變得暢通無阻。CNN的虛假不實報道就是一個很好的例子。
用工具去翻譯其他語言的內容要比親自去學習那種語言的簡單得多,所幸,現(xiàn)在已經(jīng)有很多工具可以實現(xiàn)對網(wǎng)頁的翻譯了。大家常用的任何一款翻譯軟件或者詞典都可以實現(xiàn)。這方面做的比較好的有金山詞霸,靈格斯等等。但如果這些具備翻譯功能的工具能夠和n詞酷的整段發(fā)音結合起來,一定可以有很好的效果。但是開發(fā)一個完備的語音合成系統(tǒng)顯然比開發(fā)一個整段翻譯系統(tǒng)更困難。究竟誰才能最先搶占后閱讀時代這一塊蛋糕呢?我們不關心。用戶最關心的當然是什么時候,這種集視聽于一身的瀏覽工具會真正出現(xiàn)。
加拿大傳播學家麥克盧漢曾經(jīng)有一個理論:媒介即信息。不管承載的信息內容是什么,光是一個新媒介本身的出現(xiàn),就可以對人們的傳播行為以及思維方式產生深遠的影響。從最早的不可攜帶的石質重型媒介,到紙的出現(xiàn),再到印刷機,收音機,電視,乃至電腦的出現(xiàn),人類的文明正以爆炸式的速度增長,后媒介時代這個預言到底會不會成為現(xiàn)實,我們拭目以待。
eNet硅谷動力(cio.enet.com.cn)
相關鏈接: