首頁>>>技術>>>語音應用>>>語音識別(ASR)  語音識別產(chǎn)品

語音識別應用決定智能語音行業(yè)未來成長

2011/01/04

  從智能語音技術的發(fā)展歷程來看,應用的技術推動力主要是語音技術核心算法和計算機芯片技術。二十世紀末,建立在統(tǒng)計建模和機器學習理念基礎上的語音技術核心算法逐步成熟,基于HMM(隱馬爾可夫模型)的語音合成及識別技術在實用中占據(jù)了主導地位。計算機芯片技術則遵照摩爾定律,每18個月性能提升1倍,芯片運算能力的持續(xù)增長使得更為復雜的語音技術算法不斷得以實現(xiàn)。嵌入式芯片技術特別是SOC技術的發(fā)展及芯片成本的下降,有力推動了智能語音技術在移動設備中的應用。

  語音合成技術:成熟度較高,應用廣泛。語音合成技術的研究起步于上世紀三十年代,到二十世紀末統(tǒng)計建模方法開始引入到語音合成技術中,從而提出了可訓練的語音合成方法;贖MM模型的合成技術和大語料庫波形拼接技術是目前主流的語音合成方法。語音合成技術在2000年時已達到用戶基本可接受的準實用水平,2005年開始獲得了較為廣泛的應用。未來語音合成技術將從清晰度和自然度的要求上升至對個性化合成的要求,如對語音、語調、情緒的豐富性要求等。

  語音識別技術:技術難度高,潛在需求較大。語音識別技術主要包括語意識別和聲紋識別,對語音識別的研究起步于二十世紀五十年代,從二十世紀末開始進入實際應用。語音識別在技術原理上主要采取匹配識別和檢測識別兩種識別方式,關鍵技術包括選擇識別單元、特征參數(shù)提取、聲學模型及語言模型的建立等。語音識別技術目前在桌面系統(tǒng)、移動設備和嵌入式領域均有一定程度的應用,未來的發(fā)展方向應是無限詞匯量連續(xù)語句非特定人語音識別系統(tǒng)。

  四大細分市場面臨突破。綜合考慮目前的技術能力和客戶接受度,我們認為企業(yè)級市場、車載語音市場、移動終端市場及教育娛樂市場有望在未來率先實現(xiàn)突破。我們預計國內呼叫中心語音市場有望于未來兩年內啟動,市場規(guī)模在其后有快速增長至億元量級的可能;車載語音識別系統(tǒng)市場出現(xiàn)快速增長,市場規(guī)模有望從2009年的6430萬美元提升至2014年的2.1億美元,年均復合增長率約為26.7%;而移動終端語音市場和教育娛樂語音市場均有較大發(fā)展?jié)摿Α?br />
  高技術壁壘形成寡頭壟斷競爭格局。智能語音技術是人工智能的研究領域之一,其技術原理涉及聲學、語言學、數(shù)字信號處理、計算機科學等多個學科,同時智能語音技術的研究周期長、投入大,使得智能語音行業(yè)具有較高的進入壁壘。在全球范圍內,目前已形成寡頭壟斷競爭格局,僅有Nuance、IBM、微軟、Googe、科大訊飛等少數(shù)廠商具備較強競爭力。

海通證券



相關閱讀:
蘋果為iOS招聘語音識別技術專家 2010-12-23
美國研發(fā)語音數(shù)字指紋技術可預防電話詐騙 2010-12-22
Google手機語音搜索增加方言識別訓練 2010-12-16
智能語音技術在語言教學中的應用研討會在合肥召開 2010-12-16
解放雙手 嘗試用語音控制玩游戲 2010-12-15

熱點專題:  語音合成TTS 語音識別ASR