首頁>>廠商>>語音板卡開發(fā)商>>Aculab

Aculab的ASR (自動語音識別 ) 技術

2004/05/08

  對于那些需要把語音識別(ASR)技術引入交互式應答應用領域的開發(fā)商而言,Aculab的基于音素的語音識別引擎是理想的選擇。該引擎能把說出的詞或短語與語法規(guī)則匹配,確定識別結果。Aculab的基于主機的語音識別引擎性能卓越,而且是免費使用的。

  由于采用的是音素模型,所以用戶能方便地通過增加發(fā)音字典的條目,來定義和擴展識別詞匯表。

  采用該識別引擎的系統(tǒng)結構是完全可伸縮的:一個或多個ASR服務器可以接收并處理來自一個或多個客戶機的話音輸入,而且只有客戶機系統(tǒng)需要使用Prosody媒體處理資源卡。此外,ASR可以和Prosody板卡上的其他語音算法混合使用,來提供更多的選擇和靈活性。所有這一切,證明了Aculab對電話語音市場的一貫承諾:通過不斷地為Prosody板卡提供新功能特性,保證其無與倫比的價值。此外,這些功能都是通過Aculab的統(tǒng)一API實現的,配合全球范圍內的電信協(xié)議支持和認證,可以有效地加快應用系統(tǒng)進入市場的速度。

增強的語音識別
  Aculab的ASR識別速度快,準確度高,在識別過程中能無縫地與混合的整字/單音素/多因素模型集成。據此,一句言辭的不同部分可以通過不同的方法得到處理,從而得到識別結果。對于連續(xù)字識別,準確率高達97%。此外,為了處理易于混淆的被識別對象,系統(tǒng)還能給出帶有可信度數值的其他候選識別結果。

獨立于說話人
  為了適應由于性別、年齡和口音等因素產生的聲音變異,在所有支持的語言里,Aculab都進行了廣泛的語料分析。專用的語音信號分析算法確保了識別引擎的韌性,不受話機和電話線路質量的影響。

自然地講話
  不常用的方言使得某些特定字詞的發(fā)音與規(guī)范不同。在此情況下,開發(fā)商可以通過編輯和添加發(fā)音字典的條目,來擴展識別詞匯表。Aculab提供了方便易用的、基于Windows的詞典管理工具-ASRLexMan。一個特定的詞可以有多個不同的發(fā)音,來解決方言問題,提高識別的準確率。

運行時語法處理
  語法定義了被識別詞匯的范圍和在句子里可能出現的前后次序。該識別引擎采用的是Aculab語音語法格式(ASGF),ASGF是Java語音語法格式(JSGF)的一個子集。Aculab ASR中語法可以預先設定,也可以在運行過程中根據用戶和應用系統(tǒng)交互的需要或為適應外部因素而隨時動態(tài)定義。語法可以用基于Windows操作系統(tǒng)的管理工具ASRNetMan來編輯生成。

可擴展的結構
  由于高密度的Prosody板卡上的一個DSP可以支持多達64個通道被識別語音的饋入處理,所以通道容量指標主要取決于ASR主機服務器的處理能力。使用額外的主機可以增加通道容量。ASR結構的內在靈活性,支持一個或多個識別服務器配置,所以能充分利用Prosody資源卡的強大處理能力。

支持的語言
  同一個語音識別軟件包,能同時處理多種語言,包括:英國英語、美國英語、法語、德語、意大利語、北美西班牙語、巴西葡萄牙語、和拉丁美洲西班牙語等。應用中每次可以根據需要配置成不同語言的識別。

主機操作系統(tǒng)支持:Windows XP/2000,Linux和Sun SPARC Solaris。

可選的硬件
  基于主機的ASR應用可以通過Aculab的PCI或cPCI格式的Prosody板卡的任意語音處理固件獲得輸入的話音信號,所以允許ASR和其他基于DSP的語音處理算法并行使用,包括錄音/放音、回波抵消和DTMF檢測。這樣,在同一個硬件平臺上能支持多種語音處理技術。

  回波抵消功能是由Prosody固件提供的,它對實現人機自然交互非常重要。具體體現是支持"barge-in"功能,使得有經驗的呼叫用戶無需聽完完整的系統(tǒng)提示音,就可做出響應。

同時支持文語轉換和說話人證實
  如果ASR和文語轉換(TTS)以及說話人證實和鑒別(SVI技術)一起使用,開發(fā)商可以進一步提高IVR和呼叫中心系統(tǒng)的性能。TTS和SVI都用Prosody板卡來提供話音回放的通道,而且是可以免費獲得的。

通道容量
  典型地,采用單1.9GHz CPU的主機來擔當客戶機、服務器以及控制器,可以同時支持120個并發(fā)的語音識別通道。

性能指標和優(yōu)勢
·高識別準確率
  是通過混合采用整字/單音素/多因素模型獲得的。
·可伸縮的系統(tǒng)結構
  采用分布式服務器結構,方便系統(tǒng)功能或容量的擴展。
·大通道容量
  能提升平均每通道資源處理的價值,有效減少硬件開銷。
·Aculab統(tǒng)一API
  易于系統(tǒng)集成,加快應用程序進入市場的速度。
·免費的使用許可證
  意味著無需付費,就可以隨時隨地從Aculab的網站下載此軟件。
·用戶可定義的詞典
  ASRLexMan為開發(fā)商和系統(tǒng)集成商帶來使用過程中的靈活性。
·按字母拼讀規(guī)則
  當一個詞在詞典里不存在時,用作備選處理規(guī)則。
·標準的語法定義格式
  方便語法標記和生成。
·運行時語法處理
  支持靈活的人機對話流程設計和實現。
·脫機語法編輯
  ASRNetMan方便開發(fā)商和系統(tǒng)集成商創(chuàng)建靈活的應用。
·與說話人無關
  意味著呼叫用戶使用應用系統(tǒng)前,無需進行訓練。
·可能的選擇
  支持交互式系統(tǒng)設計的智能實現。
·識別結果的可信度
  每次識別完成之后都會返回該參數。此結果對出錯情況下的處理有幫助。
·靜音檢測
  用來確認一句言辭的起始端點,最大限度減輕系統(tǒng)處理負荷。靜音檢測的相關參數可以通過API調整。
·回波抵消
  在Prosody板卡上實現,來支持"barge-in"功能。

  預知更多信息,請聯系Aculab的銷售代表或訪問我們的網站:http://www.aculab.com

Aculab公司供稿 CTI論壇編輯



相關鏈接:
Aculab增強對Asterisk商業(yè)版的支持 2006-11-21
信令與媒體網關GroomerII的卓越IP和SS7處理能力 2006-11-17
Aculab產品的七號信令監(jiān)控功能 2006-10-11
Aculab公司的最新產品研發(fā) 2006-09-19
Aculab發(fā)布最新產品——Prosody X PCIe板卡 2006-09-14

分類信息:  語音板卡_與_語音識別ASR     技術_語音板卡_新聞   技術_語音識別_解決方案   技術_語音板卡_文摘