首頁(yè)>>>技術(shù)>>>語(yǔ)音應(yīng)用>>>語(yǔ)音識(shí)別(ASR)  語(yǔ)音識(shí)別產(chǎn)品

藏在舌尖上的“身份證”:走向民品市場(chǎng)的聲音識(shí)別技術(shù)

2006/05/30

  由于有著巨大的市場(chǎng)需求和應(yīng)用前景,以指紋、面部特征和聲音等人體部分特征為基礎(chǔ)的各種各樣的身份識(shí)別技術(shù),正在得到政府部門(mén)、企業(yè)和研究人員的重視,研發(fā)和應(yīng)用都在高速推進(jìn)。聲音識(shí)別技術(shù),如監(jiān)聽(tīng)和竊聽(tīng)技術(shù)等,也揭去了過(guò)去只為國(guó)家執(zhí)法部門(mén)所用的神秘面紗,不斷被改進(jìn)和完善,以滿足更為廣闊的市場(chǎng)需要。

  隨著現(xiàn)代通信技術(shù)的迅速發(fā)展和普及,網(wǎng)絡(luò)技術(shù)和無(wú)線通信技術(shù)等,為聲音識(shí)別技術(shù)提供了可進(jìn)行遠(yuǎn)程操控的平臺(tái),使得聲音識(shí)別技術(shù)不僅能夠?yàn)榧夹g(shù)偵察部門(mén)服務(wù),而且能夠?yàn)槠渌脩籼峁└鼮楸憬、更加?shí)用的口令和身份識(shí)別技術(shù)途徑,因此,得到了不同類(lèi)型和不同層面用戶的青睞。目前聲音識(shí)別技術(shù)主要有四大應(yīng)用領(lǐng)域,即金融系統(tǒng)、通信網(wǎng)絡(luò)系統(tǒng)、國(guó)家執(zhí)法部門(mén)和從事訪客口令識(shí)別研究的研究機(jī)構(gòu)等。

  以色列有一家成立僅6年的公司,在聲音識(shí)別技術(shù)領(lǐng)域令人刮目相看,它就是位于雷拉拉市的PERSAY公司。目前該公司在聲音識(shí)別技術(shù)領(lǐng)域擁有的三個(gè)產(chǎn)品系列,在世界各地的用戶達(dá)到了40多個(gè),如美國(guó)國(guó)土安全部正廣泛使用它的技術(shù)識(shí)別臨時(shí)訪問(wèn)者定期打來(lái)的電話聲音,核實(shí)他們?cè)诿绹?guó)的滯留情況和準(zhǔn)確位置等。

  “與競(jìng)爭(zhēng)對(duì)手的技術(shù)相比,我們擁有的技術(shù)原理,是基于生物語(yǔ)音差異來(lái)實(shí)現(xiàn)對(duì)個(gè)體語(yǔ)音識(shí)別的!惫臼紫瘓(zhí)行官奧摩格•阿萊-雷茲在接受本報(bào)記者采訪時(shí)說(shuō),“我們的語(yǔ)音識(shí)別技術(shù)不僅準(zhǔn)確性較高,而且不受任何語(yǔ)言和口音差異的限制,使用方便!

  阿萊-雷茲向記者演示了如何用聲音作為用戶口令,通過(guò)打電話進(jìn)入銀行系統(tǒng)的。記者看到,如果線路通暢、發(fā)音清晰,那么利用這種方法來(lái)識(shí)別用戶的身份,其準(zhǔn)確性可以達(dá)到100%!爱(dāng)然,即便僅僅是在技術(shù)上讓任何一種識(shí)別方法做到完美無(wú)暇,都是非常困難的,但是,如果兩種識(shí)別方法配合使用,如聲音識(shí)別與密碼配合使用,那么其可靠性將會(huì)大大提高!

  除了上述聲音口令技術(shù)被銀行等金融系統(tǒng)用于識(shí)別用戶身份外,PERSAY于2002年開(kāi)發(fā)出了識(shí)別通話者身份的自由通話技術(shù)——FreeSpeech。該技術(shù)產(chǎn)品通過(guò)生物語(yǔ)音識(shí)別技術(shù),可以向有關(guān)部門(mén)提供電話另一端說(shuō)話者的準(zhǔn)確身份,確保通話的有效性,為通話雙方提供便利。阿萊-雷茲告訴記者,F(xiàn)reeSpeech的用途非常廣泛,比如,當(dāng)通話人需要向政府有關(guān)部門(mén)匯報(bào)情況和了解信息,用戶需要在服務(wù)商那里更改個(gè)人資料(信用卡號(hào)、服務(wù)期限等)和更新合同等等,首先需要確認(rèn)的是通話人的身份,如果通話人的身份不能得到確認(rèn),那么,就無(wú)法使用電話這種便捷的方法去解決問(wèn)題。

  FreeSpeech具有的技術(shù)特點(diǎn)包括,不受語(yǔ)言和口音差異限制,準(zhǔn)確性高,具有干線與支線同等的音頻獲取能力,提供網(wǎng)絡(luò)服務(wù)APIs,與CTI和CRM應(yīng)用兼容,提供網(wǎng)絡(luò)管理服務(wù)等。

  2004年,PERSAY又為情報(bào)和執(zhí)法部門(mén)研制出了一種可以根據(jù)電話,來(lái)追蹤通話人的技術(shù)產(chǎn)品———S.P.I.D(說(shuō)話者身份)。這一技術(shù)利用有線和無(wú)線通訊網(wǎng)絡(luò),可以使政府執(zhí)法部門(mén)從成千上萬(wàn)的通話者中,鑒別出正在追蹤目標(biāo)的通話聲音,從而找到追蹤目標(biāo)。該技術(shù)在2005年通過(guò)了美國(guó)國(guó)家標(biāo)準(zhǔn)和技術(shù)研究所的鑒定,被認(rèn)為是一種不受通話內(nèi)容限制、準(zhǔn)確率高的通話人身份識(shí)別技術(shù)。

  作為一家已經(jīng)進(jìn)入快速發(fā)展通道的創(chuàng)新公司,年輕的阿萊-雷茲認(rèn)為在不久的將來(lái)會(huì)有更多的用戶使用他們的技術(shù)。“盡管聲音識(shí)別技術(shù)在口令和身份識(shí)別技術(shù)領(lǐng)域是一項(xiàng)比較新的技術(shù),目前仍處于不斷改進(jìn)和提升的階段,但是我們擁有的這三種產(chǎn)品技術(shù),都已經(jīng)具有規(guī);袌(chǎng)應(yīng)用的能力。目前推廣和應(yīng)用這種技術(shù)的主要困難是,需要花費(fèi)大量時(shí)間和精力,通過(guò)現(xiàn)場(chǎng)演示等方法,去說(shuō)服各種用戶了解和相信聲音識(shí)別技術(shù)的可靠性和便捷性!

科技日?qǐng)?bào)



相關(guān)鏈接:
語(yǔ)音識(shí)別前端系統(tǒng)提高配送中心員工選貨的正確性 2006-03-14
語(yǔ)音技術(shù)“入侵”電話服務(wù) 顛覆傳統(tǒng)通信 2006-03-10
Aculab的Prosody語(yǔ)音卡支持teliSpeech語(yǔ)音識(shí)別技術(shù) 2006-03-06
探尋聲紋認(rèn)證技術(shù)的產(chǎn)業(yè)化模式 2006-02-27
鄭方:產(chǎn)學(xué)研合作肩負(fù)標(biāo)準(zhǔn)與產(chǎn)業(yè)重任 2006-02-27

相關(guān)頻道:           文摘   技術(shù)_語(yǔ)音識(shí)別_文摘