首頁(yè)>>廠商>>CTI系統(tǒng)平臺(tái)廠商>>北京欣方

發(fā)表評(píng)論分享按鈕

語(yǔ)音識(shí)別技術(shù)在自動(dòng)外呼和洗號(hào)系統(tǒng)的應(yīng)用與優(yōu)勢(shì)

2011/07/18

摘要

  隨著呼叫中心系統(tǒng)呼出業(yè)務(wù)量的不斷增多,正確識(shí)別號(hào)碼狀態(tài),提高撥號(hào)效率已經(jīng)成為外呼型呼叫中心需要解決的重要問(wèn)題。本文首先介紹了號(hào)碼識(shí)別在自動(dòng)外呼和洗號(hào)系統(tǒng)中的意義,接著分析了信令分析檢測(cè)方式的不足,進(jìn)而提出一種基于語(yǔ)音識(shí)別技術(shù)的外呼系統(tǒng),并闡述了語(yǔ)音識(shí)別技術(shù)在提高工作效率及降低成本上的優(yōu)勢(shì)及意義。

關(guān)鍵詞:呼叫中心;自動(dòng)外呼;洗號(hào);語(yǔ)音識(shí)別;

1.引言

  隨著呼叫中心市場(chǎng)的不斷成熟,呼入型業(yè)務(wù)基本飽和,通過(guò)電話由坐席主動(dòng)對(duì)客戶進(jìn)行拜訪和推銷產(chǎn)品的呼出型業(yè)務(wù)正逐步成為贏得客戶的關(guān)鍵手段。而如何對(duì)外呼號(hào)碼進(jìn)行準(zhǔn)確識(shí)別和篩選(“洗號(hào)”),以通過(guò)提高撥號(hào)效率來(lái)提升營(yíng)銷利潤(rùn),已經(jīng)成為迫在眉睫的問(wèn)題。

  現(xiàn)有的自動(dòng)外呼及洗號(hào)系統(tǒng)中的號(hào)碼識(shí)別方法一般是通過(guò)信令處理等技術(shù)來(lái)實(shí)現(xiàn),而基于信令檢測(cè)的方式在準(zhǔn)確性和效率保證上又存在嚴(yán)重的問(wèn)題。

  為了提高號(hào)碼識(shí)別的準(zhǔn)確性與效率,提出了一種基于語(yǔ)音識(shí)別技術(shù)的號(hào)碼識(shí)別方法,可應(yīng)用于自動(dòng)外呼和洗號(hào)系統(tǒng)。該方法通過(guò)與信令檢測(cè)方法相結(jié)合,可使自動(dòng)外呼和洗號(hào)系統(tǒng)中的語(yǔ)音識(shí)別準(zhǔn)確率達(dá)到95%以上;有效解決了傳統(tǒng)外呼和洗號(hào)系統(tǒng)中現(xiàn)存的弊端,很大程度上提高了撥號(hào)效率,從而達(dá)到了提高呼叫中心效益的目的。

2.自動(dòng)外呼和洗號(hào)系統(tǒng)

  自動(dòng)外呼系統(tǒng)是一個(gè)自動(dòng)執(zhí)行企業(yè)用戶定制的外呼任務(wù)的系統(tǒng)。它執(zhí)行的特點(diǎn)是系統(tǒng)根據(jù)座席狀態(tài)和算法策略對(duì)指定號(hào)碼集自動(dòng)發(fā)起呼叫,通過(guò)分析呼叫過(guò)程中的信令和信號(hào),對(duì)呼叫采取合適的處理。具體處理方法為:當(dāng)呼叫接通時(shí),系統(tǒng)將呼叫轉(zhuǎn)接給座席;若用戶未接通,則繼續(xù)呼叫下一個(gè)號(hào)碼,同時(shí)代替座席記錄當(dāng)前呼叫的狀態(tài)。

  洗號(hào)系統(tǒng)也是自動(dòng)外呼系統(tǒng)的一個(gè)重要應(yīng)用,其原理是系統(tǒng)提前將雜亂的號(hào)碼試呼一遍,清除一些無(wú)效號(hào)碼,如空號(hào)、停機(jī)、欠費(fèi)、格式錯(cuò)誤等,以此來(lái)提高外呼效率。

  值得注意的是,自動(dòng)外呼和洗號(hào)系統(tǒng)都需要通過(guò)號(hào)碼識(shí)別來(lái)確定所呼號(hào)碼的狀態(tài),系統(tǒng)的效率很大程度上取決于其對(duì)號(hào)碼的識(shí)別能力。然而,目前常見(jiàn)的號(hào)碼狀態(tài)分為多種類型:
  1. 號(hào)碼不可用(空號(hào),停機(jī),欠費(fèi),地址不全等);

  2. 暫時(shí)不可用(關(guān)機(jī),不在服務(wù)中,通話中等);

  3. 可用(無(wú)應(yīng)答,被叫忙等)、自動(dòng)應(yīng)答號(hào)碼(傳真、企業(yè)總機(jī)等)。
  由于三大運(yùn)商營(yíng)對(duì)如此繁多的號(hào)碼狀態(tài)未作統(tǒng)一標(biāo)準(zhǔn),加上信令檢測(cè)方式存在很多弊端,使得對(duì)號(hào)碼的識(shí)別具有相當(dāng)大的挑戰(zhàn)。首先,錯(cuò)誤的識(shí)別會(huì)導(dǎo)致部分?jǐn)?shù)據(jù)的丟失,使企業(yè)失去一些潛在用戶,直接導(dǎo)致利益損失。其次,識(shí)別速度過(guò)慢,不但影響系統(tǒng)的整體效率,還會(huì)影響座席人員的工作熱情,這也成為了提高企業(yè)利潤(rùn)的瓶頸。因此,如何對(duì)號(hào)碼進(jìn)行正確、高效的識(shí)別是當(dāng)前要解決的關(guān)鍵問(wèn)題,這也使得對(duì)號(hào)碼識(shí)別方式的研究具有了現(xiàn)實(shí)意義。

3.號(hào)碼識(shí)別方式分析

  在實(shí)際網(wǎng)絡(luò)中,表示被叫用戶狀態(tài)有三種方式:標(biāo)準(zhǔn)Tone音、提示音和7號(hào)信令。每種方式又可細(xì)分為多種表現(xiàn)形式:

  標(biāo)準(zhǔn)的Tone音:振鈴音,忙音,空號(hào),不可達(dá)音等,這種方式在固定網(wǎng)中比較常見(jiàn)。

  提示音:“該號(hào)碼不存在”,“該號(hào)碼是空號(hào)”,“該號(hào)碼已停機(jī)”等。通過(guò)提示音來(lái)顯示當(dāng)前被叫用戶狀態(tài)多發(fā)生在移動(dòng)網(wǎng)絡(luò)中。

  7號(hào)信令。在呼叫釋放的信令(releasecall),會(huì)帶釋放原因:“Unallocated Num”“user busy”等,也常被移動(dòng)網(wǎng)絡(luò)采用。

  目前自動(dòng)外呼和洗號(hào)系統(tǒng)主要采用信令分析、語(yǔ)音識(shí)別技術(shù)(包括檢測(cè)音頻)等進(jìn)行號(hào)碼識(shí)別和篩選。下面將對(duì)幾種檢測(cè)方式進(jìn)行詳細(xì)說(shuō)明。

  3.1 信令檢測(cè)方式分析

  一般情況下,號(hào)碼識(shí)別需根據(jù)當(dāng)前呼叫失敗的原因來(lái)判斷,因此,通常會(huì)利用呼叫過(guò)程中產(chǎn)生的信令來(lái)檢測(cè)。然而這種檢測(cè)方式存在嚴(yán)重的準(zhǔn)確性和效率問(wèn)題,不能滿足呼叫中心自動(dòng)外呼和洗號(hào)的功能要求。

  首先,采用這種方式進(jìn)行檢測(cè)準(zhǔn)確性差。其原因是:在中國(guó)三大運(yùn)營(yíng)商現(xiàn)網(wǎng)中,反映被叫用戶的狀態(tài)沒(méi)有統(tǒng)一的標(biāo)準(zhǔn)。甚至同一個(gè)運(yùn)營(yíng)商的同一個(gè)本地網(wǎng)都會(huì)出現(xiàn)不相同的情況。標(biāo)準(zhǔn)的不統(tǒng)一,為信令的檢測(cè)造成了困難,經(jīng)常出現(xiàn)號(hào)碼狀態(tài)無(wú)法識(shí)別、錯(cuò)誤識(shí)別的情況。

  其次,采用信令檢測(cè)方式效率低下,由于PSTN普遍實(shí)施了呼叫失敗后語(yǔ)音提示的人性化功能,語(yǔ)音提示時(shí)長(zhǎng)可達(dá)60秒,然后才發(fā)送信令。這樣嚴(yán)重影響了信令檢測(cè)的效率。

  下例為對(duì)河北移動(dòng)某呼叫中心自動(dòng)外呼系統(tǒng)的信令測(cè)試結(jié)果分析(該系統(tǒng)使用的交換機(jī)為Dialogic IMG1010網(wǎng)關(guān),信令方式為ISUP):

  表1:信令號(hào)碼識(shí)別測(cè)試


  從歸納的情況看,只有無(wú)應(yīng)答和地址不全兩種情況是可靠信令分析來(lái)識(shí)別的,其他的5種情況都無(wú)法通過(guò)信令檢測(cè)識(shí)別。特別是暫時(shí)無(wú)法接通的語(yǔ)言提示,播放完提示音有3種不同的信令,應(yīng)該是屬于不同的情況,但是放了相同的語(yǔ)音。因此造成號(hào)碼識(shí)別錯(cuò)誤的現(xiàn)象。

  綜上,信令分析檢測(cè)方式,對(duì)于釋放7號(hào)信令來(lái)表示用戶狀態(tài)的情況是十分有效的。但是,該方式不具備區(qū)分標(biāo)準(zhǔn)Tone音和提示音的能力,同時(shí)效率低下。要準(zhǔn)確、高效的判斷用戶的當(dāng)前狀態(tài),必須要通過(guò)一種更為準(zhǔn)確可靠的方式——語(yǔ)音識(shí)別。

  3.2 語(yǔ)音識(shí)別檢測(cè)方式分析

  現(xiàn)有PSTN網(wǎng)絡(luò)普遍實(shí)施了呼叫失敗后語(yǔ)音提示或tone音的人性化功能,由于這些tone音和失敗提示音都是在臨時(shí)話路中播放的,因此信令的方式無(wú)法區(qū)分這兩種場(chǎng)景。但是語(yǔ)音識(shí)別技術(shù)恰恰是利用了這個(gè)特點(diǎn),對(duì)語(yǔ)音提示或tone音進(jìn)行快速的語(yǔ)音識(shí)別與匹配,在精確識(shí)別號(hào)碼的同時(shí),提升了識(shí)別的速率。

  首先,采用語(yǔ)音識(shí)別技術(shù)可幫助自動(dòng)外呼和洗號(hào)系統(tǒng)提高號(hào)碼識(shí)別的準(zhǔn)確率。系統(tǒng)通過(guò)語(yǔ)音匹配將相同信令的呼叫區(qū)分,幫助洗號(hào)系統(tǒng)正確的識(shí)別可用號(hào)碼,同時(shí)還能幫助自動(dòng)外呼系統(tǒng)正確的記錄座席呼叫狀態(tài),避免了因錯(cuò)誤識(shí)別而導(dǎo)致數(shù)據(jù)丟失的情況發(fā)生。

  其次,語(yǔ)音識(shí)別技術(shù)還可以幫助自動(dòng)外呼和洗號(hào)系統(tǒng)實(shí)現(xiàn)高效識(shí)別。系統(tǒng)通過(guò)特征和關(guān)鍵字匹配的方式,在幾秒鐘內(nèi)就能完成語(yǔ)音匹配,幫助自動(dòng)外呼系統(tǒng)真正的提高了座席工作效率;同樣也幫助洗號(hào)系統(tǒng)提高了效率,使其以更少的設(shè)備投入獲得更好的效益。

  綜上,采用語(yǔ)音識(shí)別技術(shù),進(jìn)行模式匹配,可以精確、高效的識(shí)別號(hào)碼狀態(tài),彌補(bǔ)了信令檢測(cè)方式的不足。但是語(yǔ)音識(shí)別技術(shù)也存在一些難點(diǎn),例如,樣本庫(kù)的建立、方言識(shí)別以及提高識(shí)別效率等等。這些技術(shù)難點(diǎn)也成為了語(yǔ)音識(shí)別檢測(cè)方式需要解決的重要問(wèn)題。

4.語(yǔ)音識(shí)別技術(shù)的應(yīng)用

  4.1 基本原理

  語(yǔ)音識(shí)別技術(shù)就是讓機(jī)器通過(guò)識(shí)別和理解過(guò)程把語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的技術(shù)。語(yǔ)音識(shí)別技術(shù)主要包括特征提取技術(shù)、模式匹配準(zhǔn)則及模型訓(xùn)練技術(shù)三個(gè)方面。它可用于對(duì)用戶呼叫失敗的情況進(jìn)行自動(dòng)分類。

  我們采用的語(yǔ)音識(shí)別技術(shù)主要靠匹配方式來(lái)進(jìn)行,分成Tone音匹配、AM音匹配和人類自然語(yǔ)音檢測(cè)三部分。具體流程圖如下:

語(yǔ)音處理流程圖

圖:語(yǔ)音處理流程圖

(VAD: Voice Activity Detection;LV: Live Speech;AM: Answering Machine)

  圖中,Tone音匹配采用模式匹配方法,可以實(shí)現(xiàn)對(duì)振鈴音,忙音,空號(hào),不可達(dá)音等100多種標(biāo)準(zhǔn)提示音的識(shí)別。AM(Answering Machine)音匹配主要負(fù)責(zé)識(shí)別傳真機(jī)、自動(dòng)答錄機(jī)等機(jī)器語(yǔ)音,同樣采用模式匹配方法,將收到的語(yǔ)音與標(biāo)準(zhǔn)樣本庫(kù)進(jìn)行比對(duì)。人類自然語(yǔ)音檢測(cè)的功能主要通過(guò)人真實(shí)聲音的檢測(cè),來(lái)判斷是否需要進(jìn)行語(yǔ)音匹配。

  4.1.1 標(biāo)準(zhǔn)Tone音匹配

  Tone音匹配采用的是模式匹配方法,將模擬語(yǔ)音信號(hào)轉(zhuǎn)換為數(shù)字信號(hào),再同音庫(kù)中的樣本進(jìn)行比對(duì),實(shí)現(xiàn)號(hào)碼狀態(tài)識(shí)別。

  在標(biāo)準(zhǔn)Tone音匹配模塊里,因?yàn)槟承﹩晤lTone音的頻率區(qū)間和DTMF之間存在重疊,為了避免不必要的混淆,采取順序檢測(cè),即首先檢測(cè)是否是DTMF,再檢測(cè)是否是單頻的Tone音。

  Tone音的一個(gè)顯要特點(diǎn)是在頻域上的某一個(gè)子帶上的能量特別強(qiáng),而且這種情況是在后續(xù)所有非靜音的連續(xù)幀上都是持續(xù)的(如圖1所示);诖颂攸c(diǎn),我們采用以下方法:

  1.取第一幀非靜音幀的16個(gè)子帶能量特征,求出其最大子帶能量所在的子帶序號(hào)(在DTMF階段是取最大的兩個(gè)子帶序號(hào))。
  2.如果最大能量值所在的子帶序號(hào)一直保持若干幀不變,則我們認(rèn)為從頻率角度滿足了作為一個(gè)Tone音的基本條件。

  由于DTMF不存在時(shí)間持續(xù)長(zhǎng)短的相關(guān)信息,所以經(jīng)過(guò)上述步驟后,只需將最大能量的兩個(gè)序號(hào)在事先準(zhǔn)備好的DTMF子帶序號(hào)表里查找即可得出結(jié)論,對(duì)于檢測(cè)DTMF顯然已經(jīng)足夠。但由于單頻的Tone音還存在持續(xù)時(shí)間長(zhǎng)短及靜音間歇的問(wèn)題,故對(duì)于輸入的信號(hào),經(jīng)過(guò)前端數(shù)據(jù)處理過(guò)程之后,要利用它是否靜音幀的信息統(tǒng)計(jì)各段長(zhǎng)度,最后,同時(shí)考慮頻率和時(shí)間段列表,如果滿足庫(kù)中某一條的相關(guān)標(biāo)準(zhǔn),才認(rèn)為是一個(gè)標(biāo)準(zhǔn)Tone音。

  4.1.2 AM音匹配

  AM音匹配同樣采用模式匹配方法,對(duì)語(yǔ)音信號(hào)進(jìn)行采樣、量化、歸一化處理后,將模擬語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)閿?shù)字語(yǔ)音信號(hào)。再與庫(kù)文件中的特征模板進(jìn)行比較,選擇出最為相近的一條作為匹配結(jié)果返回。

  假設(shè)模板庫(kù)里的特征條目的時(shí)長(zhǎng)應(yīng)該至少是一個(gè)完整的AM音模板,因此從時(shí)間長(zhǎng)度上來(lái)看,輸入的待檢測(cè)語(yǔ)音長(zhǎng)度應(yīng)小于模板里的最佳匹配項(xiàng)。

  不像Tone音檢測(cè)模塊中使用的是各幀在前端處理過(guò)程中產(chǎn)生的16個(gè)子帶上的能量具體值,這里使用的特征卻是經(jīng)過(guò)歸一化后的二進(jìn)制向量。如果要比較的兩幀特征向量分別設(shè)為:


  其中, 指異或操作,而函數(shù) 是求二進(jìn)制向量里“1”的個(gè)數(shù)。

  然后,如果輸入語(yǔ)音樣本的幀數(shù)目為 ,則總距離定義為相應(yīng)的 幀距離的和。

  至于要得到這條語(yǔ)音樣本與特征庫(kù)里某個(gè)模板的最小距離,比較傳統(tǒng)的方法是用這待匹配的 幀同模板的開(kāi)始處 幀算距離,然后將待匹配音順次后移,一直到末端為止,得到的最小距離就是這個(gè)輸入樣本同這一模板的距離。然后,在實(shí)際實(shí)現(xiàn)過(guò)程中,因?yàn)閷?duì)算法性能要求比較高,可以考慮加入不同的索引而達(dá)到減小計(jì)算次數(shù)的目的。索引的種類和方法不一而足,在此就不再贅述了。

  4.1.3 自然語(yǔ)音(Live Speech)檢測(cè)

  該部分的主要功能是利用人類自然語(yǔ)音特有的一些規(guī)律進(jìn)行啟發(fā)式判斷,從而確定是否需要進(jìn)入Tone音或AM音識(shí)別流程。該部分采用的規(guī)律如下:

  A.如果正式語(yǔ)音之前的靜音段超過(guò)某一閾值,則認(rèn)為是人類自然語(yǔ)音
  B.如果問(wèn)候語(yǔ)過(guò)長(zhǎng),時(shí)間上超過(guò)某一閾值,則認(rèn)為是應(yīng)答機(jī)錄音。
  C.如果問(wèn)候語(yǔ)之后的靜音段過(guò)長(zhǎng)以至于超過(guò)某個(gè)門限,則認(rèn)為是人類自然語(yǔ)音。
  D.如果問(wèn)候語(yǔ)中的詞語(yǔ)數(shù)目過(guò)多,則認(rèn)為是應(yīng)答機(jī)錄音。

  除此之外,我們還設(shè)定了一個(gè)檢測(cè)最大時(shí)間,如果超過(guò)這一時(shí)間還沒(méi)有一個(gè)檢測(cè)結(jié)果,則返回一個(gè)“無(wú)法判斷”的結(jié)果。

  最后,相關(guān)參數(shù)、時(shí)間以及判斷結(jié)果的關(guān)系如圖所示:

人類自然語(yǔ)音情況下各參數(shù)相對(duì)于時(shí)間軸的說(shuō)明

圖:人類自然語(yǔ)音情況下各參數(shù)相對(duì)于時(shí)間軸的說(shuō)明

自動(dòng)應(yīng)答機(jī)錄音情況下各參數(shù)相對(duì)于時(shí)間軸的說(shuō)明

圖:自動(dòng)應(yīng)答機(jī)錄音情況下各參數(shù)相對(duì)于時(shí)間軸的說(shuō)明

5.產(chǎn)品與應(yīng)用

  根據(jù)以上語(yǔ)音識(shí)別的方法,設(shè)計(jì)了基于語(yǔ)音識(shí)別技術(shù)的自動(dòng)外呼和洗號(hào)系統(tǒng)。以下部分將對(duì)該產(chǎn)品的框架及模塊進(jìn)行介紹。

  5.1 技術(shù)架構(gòu)

系統(tǒng)技術(shù)架構(gòu)

圖:系統(tǒng)技術(shù)架構(gòu)

  上圖為基于語(yǔ)音識(shí)別的自動(dòng)外呼和洗號(hào)系統(tǒng)的技術(shù)架構(gòu),由接入部分和平臺(tái)部分組成。其中終端為接入部分,提供包括PSTN傳統(tǒng)交換機(jī)、NGN軟交換和內(nèi)部分機(jī)終端等多種網(wǎng)絡(luò)和終端的接入能力。平臺(tái)部分由ACD、CTI和MS等節(jié)點(diǎn)組成,提供呼叫中心語(yǔ)音接入、控制、管理和路由等功能。

  ACD是呼叫中心的核心控制系統(tǒng),主要負(fù)責(zé)呼叫中心信令、呼叫與控制節(jié)點(diǎn),負(fù)責(zé)信令識(shí)別。支持呼叫中心業(yè)務(wù)觸發(fā)到CTI。

  CTI提供座席資源管理和排隊(duì)、路由策略,支持座席接入,同時(shí)支持MS的訪問(wèn)。

  MS(Media Server,媒體服務(wù)器)是NGN架構(gòu)中提供所有媒體資源的設(shè)備,是呼叫中心媒體匯聚與統(tǒng)一處理點(diǎn),所有的媒體資源處理都有MS來(lái)完成,包括IVR、DTMF、會(huì)議、錄音、傳真等。在媒體服務(wù)器上加入語(yǔ)音識(shí)別模塊,對(duì)收到的RTP語(yǔ)音流進(jìn)行實(shí)時(shí)的匹配和識(shí)別。

  MS中新增加的語(yǔ)音識(shí)別模塊,由前端語(yǔ)音數(shù)據(jù)處理模塊、數(shù)據(jù)管理模塊、標(biāo)準(zhǔn)Tone音匹配模塊、人類自然語(yǔ)音檢測(cè)模塊、AM音匹配模塊五部分組成,共同完成語(yǔ)音識(shí)別檢測(cè)。其模塊組成如下:

語(yǔ)音識(shí)別的模塊組成

圖:語(yǔ)音識(shí)別的模塊組成

  前端語(yǔ)音數(shù)據(jù)處理模塊,用來(lái)對(duì)語(yǔ)音進(jìn)行預(yù)處理和特征提取。數(shù)據(jù)管理模塊,主要工作為建庫(kù)。標(biāo)準(zhǔn)Tone音匹配模塊,匹配標(biāo)準(zhǔn)Tone音。人類自然語(yǔ)音(Live Speech)檢測(cè)模塊,進(jìn)行人類真實(shí)接聽(tīng)語(yǔ)音的判斷。AM音匹配模塊,從庫(kù)中匹配合適的模板音和判斷是否為庫(kù)外音。

  該模塊負(fù)責(zé)進(jìn)行語(yǔ)音識(shí)別的第一步:預(yù)處理和特征提取。該模塊在模塊處理中的地位非常重要,對(duì)于數(shù)據(jù)管理模塊來(lái)說(shuō),AM庫(kù)文件的每一條內(nèi)容是經(jīng)過(guò)前段語(yǔ)音數(shù)據(jù)處理以后的特征;而后面的三個(gè)檢測(cè)或匹配模塊都是建立在前端數(shù)據(jù)處理以后的數(shù)據(jù)基礎(chǔ)之上的。因此,前端語(yǔ)音數(shù)據(jù)處理的方法和所選用的特征對(duì)于檢測(cè)或匹配的準(zhǔn)確率和算法的效率都至關(guān)重要。

  本模塊的核心工作是對(duì)給定的Tone音標(biāo)準(zhǔn)和AM模板音庫(kù)進(jìn)行分析和特征提取,并存成相應(yīng)的特征庫(kù)文件。特征庫(kù)主要分為Tone庫(kù)和AM庫(kù),其建立過(guò)程如下:

  A.Tone庫(kù)

  Tone庫(kù)的建立過(guò)程比較簡(jiǎn)單。因?yàn)橛屑榷ǖ臉?biāo)準(zhǔn),不需要從模板文件中讀取再生成。所以,采用的方法是直接從記錄有標(biāo)準(zhǔn)Tone音標(biāo)準(zhǔn)的文本文件中逐條逐項(xiàng)讀取,然后依樣存成二進(jìn)制庫(kù)文件Tone.dat。

  B.AM庫(kù)

  AM庫(kù)的建立過(guò)程比Tone音庫(kù)稍微復(fù)雜一些,原因是要經(jīng)過(guò)從相應(yīng)的pcm文件模板進(jìn)行分析和提取特征的過(guò)程,因此就多了一個(gè)前端語(yǔ)音數(shù)據(jù)處理模塊。存入庫(kù)中的信息包括模板ID號(hào)、是否靜音幀、模板幀數(shù)目、FFT特征序列以及歸一化后的特征序列。歸一化前的特征序列會(huì)用于tone音檢測(cè)模塊,而歸一化后的特征序列用于AM匹配。

  該模塊的功能是進(jìn)行標(biāo)準(zhǔn)Tone音匹配。該系統(tǒng)采取的是順序檢測(cè),即首先檢測(cè)是否是DTMF,再檢測(cè)是否是單頻的Tone音。

  該模塊負(fù)責(zé)判斷人類真實(shí)語(yǔ)音。人類自然語(yǔ)音檢測(cè)在三個(gè)檢測(cè)或匹配模塊中是最難處理的一塊。因?yàn)楸举|(zhì)上說(shuō),自動(dòng)應(yīng)答機(jī)的話音也是人通過(guò)錄音機(jī)事先錄好的,所以從聲學(xué)層次并不能有效地將它們區(qū)分開(kāi)。該系統(tǒng)利用人類自然語(yǔ)音特有的一些規(guī)律進(jìn)行啟發(fā)式判斷,來(lái)進(jìn)行人類語(yǔ)音的識(shí)別。

  AM音匹配模塊的主要任務(wù)是將輸入的語(yǔ)音經(jīng)過(guò)處理后,與庫(kù)文件中的特征模板進(jìn)行比較,選擇出最為相近的一條作為匹配結(jié)果返回。若經(jīng)過(guò)與所有的特征模板都進(jìn)行比較后得出的最小距離仍然大于某一個(gè)門限值,則認(rèn)為輸入語(yǔ)音是庫(kù)外音。

  同時(shí),該系統(tǒng)還通過(guò)提取各地不同網(wǎng)絡(luò)、運(yùn)營(yíng)商的提示音庫(kù),建立了一個(gè)龐大的樣本庫(kù)。目前該系統(tǒng)已擁有三大運(yùn)營(yíng)商、30多個(gè)省市的近300個(gè)樣本庫(kù),可根據(jù)項(xiàng)目需要靈活加載部署,從而解決了方言識(shí)別的問(wèn)題。

  5.2 平臺(tái)架構(gòu)

  基于語(yǔ)音識(shí)別技術(shù)的自動(dòng)外呼和洗號(hào)系統(tǒng)主要由管理應(yīng)用、外呼與庫(kù)模塊、號(hào)碼與識(shí)別模塊三部分組成。每部分的功能如下:

系統(tǒng)組成

圖:系統(tǒng)組成

  5.2.1 管理應(yīng)用

  該部分由任務(wù)管理、號(hào)碼管理、提示音管理、自學(xué)系統(tǒng)四部分組成,任務(wù)管理負(fù)責(zé)創(chuàng)建洗號(hào)任務(wù),選擇號(hào)碼庫(kù),設(shè)置時(shí)間速率等。號(hào)碼管理可以實(shí)現(xiàn)包括號(hào)碼導(dǎo)入導(dǎo)出,未洗號(hào)碼、已洗號(hào)碼分類檢查,重聽(tīng)錄音等功能。提示音導(dǎo)入導(dǎo)出,試聽(tīng)檢測(cè)靠提示音管理來(lái)進(jìn)行。自學(xué)習(xí)系統(tǒng)能對(duì)不能識(shí)別號(hào)碼進(jìn)行人工干預(yù)和二次識(shí)別,將提示音加入庫(kù),從而保證了提示音樣本庫(kù)的不斷增長(zhǎng)。

  5.2.2 外呼與庫(kù)模塊

  該部分由自動(dòng)外呼模塊、號(hào)碼庫(kù)、錄音庫(kù)、提示音庫(kù)四部分組成。自動(dòng)外呼模塊:按指定速率進(jìn)行外呼,并將呼叫結(jié)果保存入庫(kù)。號(hào)碼庫(kù)用來(lái)保存各種號(hào)碼資源,特別是有效號(hào)碼,包括移動(dòng)號(hào)碼(聯(lián)通、移動(dòng)、電信),固定號(hào)碼(電信、聯(lián)通)。提示音庫(kù)樣本庫(kù)覆蓋了各地、運(yùn)營(yíng)商及網(wǎng)絡(luò)。錄音庫(kù)可對(duì)洗號(hào)結(jié)果進(jìn)行錄音,還可用于人工抽查,并且可進(jìn)行二次分析和自學(xué)習(xí),提供增值能力。

  5.2.3 呼叫與號(hào)碼識(shí)別模塊

  該部分由CTI、ACD、MS三部分組成,也是系統(tǒng)的主要組成部分。CTI負(fù)責(zé)指示ACD發(fā)起外呼,上報(bào)結(jié)果。ACD控制信令檢測(cè),而MS負(fù)責(zé)提供語(yǔ)音導(dǎo)航和自動(dòng)服務(wù)功能,可解析執(zhí)行來(lái)實(shí)現(xiàn)語(yǔ)音交互能力,是完成語(yǔ)音識(shí)別的主要部分。

  5.3 基于語(yǔ)音識(shí)別的號(hào)碼識(shí)別流程

  下圖為該產(chǎn)品基于語(yǔ)音識(shí)別的號(hào)碼識(shí)別流程,具體洗號(hào)流程如下圖:

基于語(yǔ)音識(shí)別的洗號(hào)流程

圖:基于語(yǔ)音識(shí)別的洗號(hào)流程

  洗號(hào)流程發(fā)生在呼叫建立過(guò)程中,如果存在臨時(shí)話路(彩鈴、tone音、各種識(shí)別提示音等情況),則進(jìn)入到語(yǔ)音識(shí)別過(guò)程。具體:

  1. 系統(tǒng)發(fā)起呼叫,根據(jù)返回的信令確定下一步處理流程

  2. 如果是200響應(yīng)碼,表明呼叫接通,直接轉(zhuǎn)到座席處理

  3. 如果是3XX-6XX響應(yīng)碼,表明呼叫失敗,根據(jù)信令響應(yīng)碼和Reason原因值進(jìn)行檢測(cè)

  4. 如果是18X響應(yīng)碼,表明在振鈴階段,需要根據(jù)是否帶SDP確定下一步處理

  5. 如果18X帶了SDP,表明進(jìn)入了臨時(shí)話路,那么連接語(yǔ)音識(shí)別模塊進(jìn)行匹配處理

  6. 如果18X沒(méi)有帶SDP,則表明只是普通的振鈴,無(wú)需識(shí)別
  5.4 系統(tǒng)特點(diǎn)

  語(yǔ)音識(shí)別技術(shù)應(yīng)用于號(hào)碼識(shí)別領(lǐng)域,對(duì)呼叫建立過(guò)程中臨時(shí)話路播放的語(yǔ)音進(jìn)行快速匹配,以實(shí)現(xiàn)號(hào)碼快速和精確的識(shí)別具有非凡的意義;谝陨险Z(yǔ)音識(shí)別模塊的洗號(hào)系統(tǒng),相比單靠信令檢測(cè)的洗號(hào)系統(tǒng),更高效可靠。其特點(diǎn)如下:   從技術(shù)方面來(lái)看,欣方公司的洗號(hào)系統(tǒng)目前面向PSTN(固定電話網(wǎng))、PLMN(移動(dòng)電話網(wǎng))和NGN(軟交換)網(wǎng)絡(luò),能夠支持音頻(Tone音)檢測(cè)、信令(ISDN PRI、七號(hào)信令等)處理、語(yǔ)音識(shí)別等洗號(hào)產(chǎn)品關(guān)鍵技術(shù),號(hào)碼篩選準(zhǔn)確率在95%以上,是國(guó)內(nèi)洗號(hào)系統(tǒng)中有效號(hào)碼識(shí)別率最高的產(chǎn)品之一。   在固網(wǎng)中,交換機(jī)使用Tone標(biāo)識(shí)被叫用戶狀態(tài)的比較多,如正常回鈴音、忙音等,欣方洗號(hào)系統(tǒng)針對(duì)Tone音的檢測(cè)能夠達(dá)到100%的準(zhǔn)確率。   在標(biāo)準(zhǔn)的信令處理方面,被叫的交換機(jī)會(huì)主動(dòng)釋放呼叫(Release),并在信令中包含釋放原因,如“Unallocated Num”(空號(hào))、“User Busy”(被叫忙)等。欣方洗號(hào)系統(tǒng)在信令處理方面能夠達(dá)到100%的準(zhǔn)確率。   這是欣方洗號(hào)系統(tǒng)中最具難度、同時(shí)也是最具技術(shù)含量的部分。由于國(guó)內(nèi)三大電信運(yùn)營(yíng)商在語(yǔ)音提示反映被叫狀態(tài)方面,沒(méi)有統(tǒng)一的標(biāo)準(zhǔn)。例如,同樣是被叫為空號(hào)的提示音,可能是“對(duì)不起,您撥的號(hào)碼是空號(hào)”,也可能是“對(duì)不起,您撥的號(hào)碼不存在”等等。為此,欣方洗號(hào)系統(tǒng)配置了一個(gè)可擴(kuò)展的音庫(kù),將各種提示音以及其具體的含義定義在里面。目前音庫(kù)中包含固網(wǎng)提示音600多條,移動(dòng)提示音100多條,基本上覆蓋了三大運(yùn)營(yíng)商全國(guó)各省的網(wǎng)絡(luò)提示音。   由于國(guó)內(nèi)三大電信運(yùn)營(yíng)商(特別是固網(wǎng)運(yùn)營(yíng)商)存在太多的不同品牌交換機(jī),并且各個(gè)本地網(wǎng)的提示音經(jīng)常不相同(有時(shí)候即使提示內(nèi)容相同,但是提示音的音調(diào)、語(yǔ)氣也可能不同),這就對(duì)洗號(hào)系統(tǒng)的語(yǔ)音識(shí)別能力提出了更高的要求。欣方洗號(hào)系統(tǒng)對(duì)外呼采用會(huì)議方式進(jìn)行全程錄音,會(huì)議方式錄音保證了錄音的可靠性。用戶通過(guò)對(duì)錯(cuò)誤檢測(cè)錄音的分析,可以生成新的語(yǔ)音識(shí)別樣本庫(kù),動(dòng)態(tài)加載到系統(tǒng)中。從而進(jìn)一步提高識(shí)別精準(zhǔn)度。這種自學(xué)習(xí)的語(yǔ)音識(shí)別功能,保證了欣方洗號(hào)系統(tǒng)所具備的高識(shí)別率。
  欣方洗號(hào)系統(tǒng)中單個(gè)呼叫在5秒內(nèi)完成語(yǔ)音檢測(cè),并結(jié)束呼叫。單個(gè)E1的配置情況下,每小時(shí)可以實(shí)現(xiàn)并發(fā)外呼8000個(gè)號(hào)碼。   欣方洗號(hào)系統(tǒng)軟件采用C++語(yǔ)言開(kāi)發(fā),運(yùn)行于Linux環(huán)境下。由于使用的是呼叫中心、智能網(wǎng)平臺(tái)同一套底層代碼,因此系統(tǒng)穩(wěn)定性非常高,是電信級(jí)的產(chǎn)品。同時(shí),硬件成本低,根據(jù)用戶成本,可以分別配置工控機(jī)+板卡或PC服務(wù)器+語(yǔ)音網(wǎng)關(guān)的方式。同時(shí)該平臺(tái)具有良好的擴(kuò)展性,單臺(tái)機(jī)器可支持最少1E1,最大64E1的ISDN PRI或ISUP接入。

  具有重呼機(jī)制:

  對(duì)于語(yǔ)音識(shí)別出的用戶失敗的情況,例如用戶忙、無(wú)應(yīng)答、不在服務(wù)區(qū)等情況,系統(tǒng)可設(shè)置重呼策略,包括重呼時(shí)間和重呼次數(shù)的設(shè)置。例如設(shè)置在10分鐘后重呼、重呼次數(shù)為2次,則在第1次呼叫失敗完畢后的10分鐘后進(jìn)行第1次重呼,若第1次重呼時(shí)還是無(wú)應(yīng)答等情況,將在接下來(lái)的10分鐘后進(jìn)行第二次重呼。

6.測(cè)試結(jié)果

  通過(guò)撥打固定電話、手機(jī)、軟電話、傳真機(jī)等通信終端,對(duì)語(yǔ)音識(shí)別部分每個(gè)模塊的準(zhǔn)確性、時(shí)效性、并發(fā)性和穩(wěn)定性進(jìn)行了測(cè)試,結(jié)果如下表:

  表2 語(yǔ)音匹配系統(tǒng)系統(tǒng)功能表


  從測(cè)試結(jié)果可以看出,該系統(tǒng)能與各種可能的回傳語(yǔ)音進(jìn)行匹配,實(shí)現(xiàn)準(zhǔn)確、高效的語(yǔ)音檢測(cè)分類功能。

7.成功案例

  欣方綜合信令識(shí)別和語(yǔ)音識(shí)別技術(shù),為自動(dòng)外呼和洗號(hào)系統(tǒng)提供了完善的技術(shù)方案,典型案例如下: 8.結(jié)束語(yǔ)

  本文提出了一種基于語(yǔ)音識(shí)別的檢測(cè)方法,該方法采用模式匹配對(duì)tone音、AM音進(jìn)行快速匹配,可以準(zhǔn)確地識(shí)別號(hào)碼狀態(tài),很好的彌補(bǔ)了信令檢測(cè)方式的不足,很大程度上提高了號(hào)碼識(shí)別的準(zhǔn)確率與效率。

  目前,基于語(yǔ)音識(shí)別的檢測(cè)方法已經(jīng)產(chǎn)品化,并成功的應(yīng)用到河北移動(dòng)卓望和信元博雅固話洗號(hào)平臺(tái)上。經(jīng)過(guò)測(cè)試,該系統(tǒng)具有良好的并發(fā)性與穩(wěn)定性,同時(shí)通過(guò)對(duì)號(hào)碼的有效甄別和篩選,顯著減少了座席等待時(shí)長(zhǎng),顯著減少了座席等待時(shí)長(zhǎng),提高了撥號(hào)效率,進(jìn)而降低了外呼成本。

  隨著呼叫中心市場(chǎng)的成熟,基于語(yǔ)音識(shí)別檢測(cè)方法會(huì)對(duì)提高呼叫中心的效率、增加企業(yè)利潤(rùn)具有重要意義,其應(yīng)用前景將十分廣闊。但是在號(hào)碼識(shí)別領(lǐng)域,仍有許多值得研究的問(wèn)題。例如,隨著樣本庫(kù)的擴(kuò)增,號(hào)碼識(shí)別的準(zhǔn)確度和效率也會(huì)隨之下降,因此采用區(qū)別于模式匹配的ASR語(yǔ)音識(shí)別方法來(lái)進(jìn)行號(hào)碼識(shí)別,將是我們研究的下一個(gè)重點(diǎn)。
共 4 頁(yè):1 2 3 4 

作者供稿 CTI論壇編輯



相關(guān)閱讀:
北京欣方承建河北博岳外呼呼叫中心系統(tǒng) 2011-07-15
案例:河南農(nóng)信部署ITSM服務(wù)平臺(tái) 2011-06-10
欣方中繼網(wǎng)關(guān)CIN-MG 2011-05-10
欣方外包呼叫中心及電銷企業(yè)洗號(hào)系統(tǒng)方案 2011-05-09
欣方多媒體呼叫中心系統(tǒng)解決方案 2011-05-06

熱點(diǎn)專題:  語(yǔ)音合成TTS 語(yǔ)音識(shí)別ASR  呼叫中心    電話營(yíng)銷