英國(guó)東英吉利大學(xué)日前發(fā)布的新成果顯示,該校研究人員開(kāi)發(fā)的新型視覺(jué)語(yǔ)音識(shí)別系統(tǒng)能像專業(yè)人員那樣識(shí)別唇語(yǔ),且識(shí)別度更精確,未來(lái)在案件偵查以及輔助聽(tīng)力和語(yǔ)言有障礙的人士方面具有廣泛用途。
據(jù)新華網(wǎng)29日消息,據(jù)研究人員介紹,無(wú)論是專業(yè)人士還是現(xiàn)有的視覺(jué)語(yǔ)音電腦識(shí)別系統(tǒng),在讀唇語(yǔ)時(shí)一個(gè)最大挑戰(zhàn)是如何區(qū)別容易混淆的發(fā)音,如英文中“p”、“b”、“m”發(fā)音時(shí),唇部動(dòng)作都非常相似,很難區(qū)別。但最新開(kāi)發(fā)的電腦系統(tǒng)利用特別設(shè)計(jì)的程序,能分辨出圖像中唇部最細(xì)微的變化,并且完全不需要語(yǔ)音信息輔助。
參與這項(xiàng)研究的東英吉利大學(xué)學(xué)者海倫·貝爾說(shuō),發(fā)“p”、“b”、“m”這樣的音時(shí),唇部動(dòng)作還是會(huì)有肉眼不易察覺(jué)的差別,這款電腦程序會(huì)不斷學(xué)習(xí)和積累相似發(fā)音的唇部動(dòng)作,并進(jìn)行相關(guān)分類,從而不斷提高識(shí)別的精確度。
貝爾表示,未來(lái)經(jīng)過(guò)進(jìn)一步優(yōu)化,這一系統(tǒng)能夠運(yùn)用在多個(gè)領(lǐng)域中,除了用來(lái)幫助有聽(tīng)力和語(yǔ)言障礙的人士,相關(guān)技術(shù)也會(huì)對(duì)人工智能的發(fā)展起到很好的助推作用。