首頁>>>技術>>>語音應用>>>語音識別(ASR)  語音識別產(chǎn)品

觀察:漢字智能識別產(chǎn)業(yè)何時成形

2002/08/26

  在信息時代的今天,以OCR、手寫、語音等技術為核心的漢字智能識別技術,以解決漢語世界的信息輸入問題為目標,已經(jīng)衍生出了眾多的技術、產(chǎn)品、市場、應用和服務,并有望形成一個龐大、完整而且不斷發(fā)展的“漢字智能識別產(chǎn)業(yè)”。

  緩慢的啟動期

  我國早在20世紀70年代末就已經(jīng)開始進行漢字識別的研究,然而與國外相比,我國智能識別輸入的普及和應用,在很長一段時間里都不盡如人意。例如OCR技術,國外在金融、保險、稅務等領域的應用至少有15年的歷史,而與此對應的是,國內(nèi)相關行業(yè)對OCR產(chǎn)品和技術的應用最近幾年才剛剛起步。

  為什么我國的漢字智能識別的應用會經(jīng)過這樣一個緩慢的啟動時期?主要有兩個困難:一是漢字智能識別技術本身所固有的技術困難,在很長一段時間里還不夠成熟,難當應用重任;二是漢字智能識別技術的應用面過于狹窄,應用不夠豐富,僅僅局限于掃描儀OCR軟件、手寫筆等幾個有限的“圈子”里。正是這兩個因素導致了國內(nèi)漢字智能識別技術應用的“慢啟動”。

  堅定的推動者

  談漢字識別,有一個公司名字我們不能不提,那就是漢王公司。在國內(nèi),漢字識別的歷史幾乎可以說也是漢王的歷史。從1992年起,漢王把手寫技術嵌入PDA,給整個PDA產(chǎn)業(yè)帶來不小的飛躍,成就了一大批像商務通、名人、快譯通這樣的廠商。

  源于中國科學院自動化所文字識別工程中心的漢王科技,經(jīng)過前赴后繼十多年的持續(xù)攻關,已經(jīng)在智能識別的OCR、手寫識別、語音識別三項核心技術上積累了足夠的優(yōu)勢,為相應產(chǎn)品和應用的開拓奠定了堅實的基礎,而且這也正是漢王科技開拓非鍵盤輸入產(chǎn)業(yè)的核心能力所在。

  目前,漢王對業(yè)務做了整合,把業(yè)務分成四個大塊:智能業(yè)務群、數(shù)碼業(yè)務群、生物特征業(yè)務群、應用集成業(yè)務群。

  談到漢字識別的應用,漢王公司總裁劉迎建舉了一個例子:去年金稅工程,用的就是漢王的高速掃描儀和稅票號碼識別技術。以前靠人力輸入會出現(xiàn)大量錯誤,而漢王識別技術將錯誤控制在萬分之一,數(shù)據(jù)非常準確。所以,識別技術對行業(yè)客戶是非常重要的。

  產(chǎn)業(yè)前景誘人

  一個產(chǎn)業(yè)的形成,首先要有一個非常好的核心技術,漢字識別產(chǎn)業(yè)也是一樣。隨著漢王十幾年來的不斷努力,智能識別技術已日臻成熟。目前,漢王OCR技術對于印刷體漢字的識別率最高達到99%以上,在此技術基礎上的一系列票據(jù)識別系統(tǒng)、表格識別系統(tǒng)等等都已經(jīng)獲得了應用。漢王的手寫識別在硬件上已經(jīng)實現(xiàn)了無線無源技術,達到了國際一流水平;在軟件上,手寫識別擺脫了對筆順的依賴,并且實現(xiàn)了從漢字工整字識別、連筆字識別到行草字識別的跨越,并且可以識別GBK字符集中的所有漢字。

  技術的成熟奠定了產(chǎn)業(yè)形成的基礎,而廣闊的應用才是產(chǎn)業(yè)成型的催化劑。劉迎建認為,要想把市場做大,就必須將技術創(chuàng)新和應用創(chuàng)新結合起來,并由此打開整個市場的發(fā)展大門。在行業(yè)信息化如火如荼的今天,電子政務的手寫簽名系統(tǒng)、公安、教育、金融等各行各業(yè)的各種票據(jù)和證件的識別輸入系統(tǒng)等等,無不擁有著及其廣闊的應用前景和市場前景。越來越多的人開始用上了PDA、手機、名片通、手寫板、語音錄入產(chǎn)品……整個漢字智能識別的產(chǎn)業(yè)前景十分廣闊。

賽迪網(wǎng) 中國信息化(industry.ccidnet.com)


相關鏈接:
微軟Xbox游戲機提供網(wǎng)上語音通信服務 2002-08-22
科大訊飛新成果:操作PDA用口不用手 2002-08-21
「言豐-文語轉(zhuǎn)換引擎」與Edify IVR成功整合 2002-08-21
嵌入式語音技術離我們有多遠? 2002-08-15
Genesys語音門戶產(chǎn)品獲ICCM獎項 2002-08-14

分類信息:  語音合成TTS_與_語音識別ASR     新聞頻道   技術_語音合成_新聞   技術_語音識別_新聞