中科信利語(yǔ)種識(shí)別引擎能夠在連續(xù)語(yǔ)音中自動(dòng)提取語(yǔ)音的語(yǔ)種信息。
中科信利的語(yǔ)種識(shí)別技術(shù)將從聲學(xué)層特征和音子序列特征的提取,分別采用了聲學(xué)建模和語(yǔ)法建模的方法,來(lái)描述這些特征的空間分布情況,并且以此來(lái)構(gòu)建高層的得分向量空間,通過(guò)分類(lèi)器對(duì)得分向量進(jìn)行劃分,以達(dá)到自動(dòng)分類(lèi)判決的目的,以使得語(yǔ)種識(shí)別技術(shù)能滿足實(shí)際的應(yīng)用需求。
工作原理:
功能模塊:
預(yù)處理:將語(yǔ)音分段,盡可能的保證每段語(yǔ)音只包含同一個(gè)說(shuō)話人或者同一類(lèi)非語(yǔ)音,此外,也要保證檢測(cè)出的說(shuō)話人或者同一類(lèi)非語(yǔ)音的虛轉(zhuǎn)折點(diǎn)少;噪聲檢測(cè),檢測(cè)出電話語(yǔ)音數(shù)據(jù)中包含的傳真音、震鈴、音樂(lè)彩鈴等非有效說(shuō)話人語(yǔ)音。
特征提。在語(yǔ)種識(shí)別技術(shù)中,選取能夠表征語(yǔ)種類(lèi)別特征的有效而可靠的特征參量,是保證識(shí)別性能的重要因素之一。語(yǔ)音信號(hào)的長(zhǎng)時(shí)差分頻譜特征,包含了語(yǔ)音信號(hào)中的語(yǔ)義信息、說(shuō)話人信息、語(yǔ)種信息。分析語(yǔ)音信號(hào)的頻譜特性可以用來(lái)確認(rèn)各個(gè)目標(biāo)語(yǔ)種。
模式匹配:指的是通過(guò)建立統(tǒng)計(jì)模型,將低層聲學(xué)特征轉(zhuǎn)換為高層的得分向量特征。中科信利的語(yǔ)種識(shí)別系統(tǒng)中,目標(biāo)是對(duì)各個(gè)待識(shí)語(yǔ)種建立可靠模型,保證語(yǔ)種識(shí)別系統(tǒng)的性能。
判決規(guī)則:語(yǔ)種識(shí)別系統(tǒng)的輸出一般都是對(duì)各個(gè)目標(biāo)語(yǔ)種有個(gè)打分,這些得分都是通過(guò)將測(cè)試語(yǔ)音同模型庫(kù)進(jìn)行似然概率計(jì)算或者進(jìn)行距離度量所得到。
技術(shù)特點(diǎn):
- 與發(fā)音人無(wú)關(guān),與傳輸信道無(wú)關(guān)。系統(tǒng)對(duì)用戶的輸入聲音進(jìn)行鑒別和確認(rèn),可以來(lái)源不同的信道。
- 對(duì)語(yǔ)音長(zhǎng)度有一定的要求。待識(shí)別的測(cè)試語(yǔ)音有效長(zhǎng)度不小于3秒。
- 識(shí)別速度快,能確保實(shí)時(shí)識(shí)別。說(shuō)話人識(shí)別引擎每次一對(duì)一比對(duì),在普通PC上具有0.01倍以上的實(shí)時(shí)率,并且支持多路并發(fā)識(shí)別。
- 操作點(diǎn)調(diào)整方便:可按不同的應(yīng)用需求調(diào)整操作點(diǎn)閾值,可以調(diào)整虛警率和漏警率,使最終準(zhǔn)確率達(dá)到最高或使錯(cuò)誤率降到最低。
- 操作點(diǎn)調(diào)整方便,可按不同的應(yīng)用需求調(diào)整操作點(diǎn)閾值,使系統(tǒng)性能根據(jù)應(yīng)用需求達(dá)到最優(yōu)。
- 支持自動(dòng)添加新語(yǔ)種的訓(xùn)練,滿足用戶擴(kuò)充。
性能指標(biāo):