吳曉如:語音技術(shù)在銀行信息化的應(yīng)用
2005/11/11
11月11日,中國中小銀行信息化發(fā)展高層論壇在北京隆重召開,本次會(huì)議將以其主題的獨(dú)家性成為本年度最具操作指導(dǎo)意義的中小銀行信息化盛會(huì)。騰訊財(cái)經(jīng)獨(dú)家圖文直播本次會(huì)議。
以下為科大訊飛吳曉如博士發(fā)言實(shí)錄:
吳曉如:銀行系統(tǒng)的各位領(lǐng)導(dǎo)各位來賓大家下午好,首先我代表這一次會(huì)議的合作方之一科大訊飛向銀行系統(tǒng)的朋友參加銀行信息化高層論壇表示熱烈歡迎。
今天介紹的主要是語音技術(shù),以及語音技術(shù)在銀行信息化的應(yīng)用,首先簡單介紹一下語音技術(shù),同時(shí)簡單介紹一下科大訊飛技術(shù)公司。語音技術(shù)在銀行系統(tǒng)最主要的應(yīng)用就是呼叫中心的應(yīng)用。呼叫中心又稱為客戶服務(wù)中心,他是把計(jì)算機(jī)和電信集成技術(shù)整合在一起,形成以電話與用戶溝通的手段,第一代呼叫中心是電話熱線,如果撥打電話越來越多就需要呼叫中心,首先是簡單的把多個(gè)線路分配到不同的專家那里去為不同的客戶提供解答。第二代呼叫中心發(fā)現(xiàn)很多用戶提的共性問題可以通過同樣的方式解答,也就是自動(dòng)把答案錄在系統(tǒng)里面,用戶提供操作可以知道答案。另外如果用戶問的信息是動(dòng)態(tài)和個(gè)性化的,需要得到答案都不一樣,這些信息很難通過實(shí)時(shí)錄音實(shí)現(xiàn),就催生智能語音技術(shù)在呼叫中心的應(yīng)用。
語音技術(shù)研究目標(biāo)是使各種智能設(shè)備向人一樣能聽會(huì)說,主要包含兩個(gè)重要的技術(shù),一個(gè)是話音合成,是把任意文本信息或者數(shù)據(jù)信息自動(dòng)的實(shí)時(shí)轉(zhuǎn)化為標(biāo)準(zhǔn)流的語音,這樣給智能設(shè)備提供一個(gè)人工的嘴巴,同時(shí)還有一個(gè)語音識(shí)別技術(shù),可以把語音變成語音命令也可以變成聽寫機(jī)。語音識(shí)別在呼叫中心主要有什么應(yīng)用,隨著銀行上面業(yè)務(wù)擴(kuò)展越來越多,通過按鍵式操作很難滿足用戶的需求,用戶要完成一個(gè)請(qǐng)求要做很多次按鍵,而且按鍵很復(fù)雜,語音識(shí)別即使有一千個(gè)5千個(gè)命令,只要把希望的請(qǐng)求說過系統(tǒng)聽,系統(tǒng)就理解這個(gè)請(qǐng)求,使呼叫中心完成這樣的應(yīng)答。因此語音技術(shù)可以用在社會(huì)生活方方面面。
下面舉例說明語音在社會(huì)生活的應(yīng)用。第一個(gè)應(yīng)用是銀行業(yè)來說在電信系統(tǒng)的應(yīng)用,2004年7月份中國工商銀行總行在全國同時(shí)布點(diǎn)新的電話銀行,統(tǒng)一使用科大訊飛TTS技術(shù),應(yīng)用銀證通,外匯買賣,原來很難提供,現(xiàn)在可以通過交互式語音技術(shù)來提供了,語音合成就是自動(dòng)把文本轉(zhuǎn)化成語音,所以叫TTS。TTS可以滿足信息海量動(dòng)態(tài)信息,通過電話的查詢,這里面有一個(gè)當(dāng)時(shí)從工商銀行總行現(xiàn)場錄音的演示樣例。(示例)這完成由計(jì)算機(jī)生成的語音,所以現(xiàn)在計(jì)算機(jī)合成的語音這是2004年的技術(shù),現(xiàn)在技術(shù)已經(jīng)有所提升,這已經(jīng)標(biāo)準(zhǔn)流暢滿足需求。語音在其他方面也有很多需求,剛才也交流了一下,比如智能終端上的應(yīng)用,比如把我們語音合成做到手機(jī)里,以前可以聲控?fù)芴?hào),另外可以聽短信,另外可以連接電子圖書館,可以聽電子圖書,可以把語音技術(shù)封裝成芯片,在海南馬自達(dá)可以用語音導(dǎo)航。另外車載設(shè)備,有一款這種手上拿的裝置,可以改變?cè)瓉韨鹘y(tǒng)的音響,可以聽文本,在回家路上一邊開車一邊聽相關(guān)信息。
在電信增值交互系統(tǒng)有廣泛應(yīng)用,比如炫鈴,要記音樂對(duì)應(yīng)的代碼,現(xiàn)在有了語音技術(shù),就不再需要了,只要撥通一個(gè)聯(lián)通或電信的統(tǒng)一客服號(hào),你說出希望下載的鈴聲就可以自動(dòng)幫你完成,大大提高了產(chǎn)品的易用性?拼笥嶏w和微軟成立合肥微軟技術(shù)中心,以.NET為平臺(tái),推進(jìn)語音技術(shù)在政府信息化中的推廣。
下面簡單介紹一下科大訊飛是1999面在中國科大人機(jī)語音實(shí)驗(yàn)室基礎(chǔ)上組建的,創(chuàng)業(yè)員工18人注冊(cè)資金300萬,現(xiàn)在員工300多人,注冊(cè)資金近1億。股東單位除了當(dāng)時(shí)的中國科技大學(xué)之外,有聯(lián)想投資,上海復(fù)星以及信息產(chǎn)業(yè)部。科大訊飛雖然公司成立六年,但是當(dāng)時(shí)科技大學(xué)一直得到國家重點(diǎn)科學(xué)攻關(guān)項(xiàng)目的支持,我們?cè)趪鴥?nèi)國際評(píng)比都是大幅度領(lǐng)先,2003年得到杰出青年獎(jiǎng)和國家科學(xué)二等獎(jiǎng)。很多用戶剛剛接觸語音技術(shù)的時(shí)候,聽上去概念很好但是是不是有可用性,98年之前產(chǎn)生的語音很難被人聽懂,現(xiàn)在產(chǎn)生的語音已經(jīng)標(biāo)準(zhǔn)流暢了,現(xiàn)在聽一下98年之前的語音效果和現(xiàn)在的語音效果。大家聽著比較難,現(xiàn)在經(jīng)過幾年以后有比較大的改善。這其實(shí)就是最新的語音合成的語音,這是國家八六三標(biāo)準(zhǔn)文本,去年又邀請(qǐng)日本、歐美的單位進(jìn)行技術(shù)評(píng)準(zhǔn),科大訊飛在自然度上面,這次是兩兩相比,大家可以從上面看到,科大訊飛系統(tǒng)自然度大幅度領(lǐng)先其他的參賽單位,在去年八六三項(xiàng)目評(píng)選做了有趣的測試,選了三個(gè)國家播音員和三個(gè)自然人,經(jīng)過這一次評(píng)測之后,平均得分播音員4.7,一般自然人3.7,這個(gè)系統(tǒng)還達(dá)到4分更加標(biāo)準(zhǔn)一些,這評(píng)測以信息發(fā)布的內(nèi)容,如果涉及感情,疑問感嘆,人更強(qiáng)一些。
科大訊飛除了現(xiàn)在在中文上做的語音合成做的工作,現(xiàn)在也有英文合成系統(tǒng),所以現(xiàn)在銀行信息化過程中對(duì)國際化的需求也可以逐漸滿足,包含也有粵語的合成系統(tǒng),F(xiàn)在多語種的合成科大訊飛還在不斷往前推進(jìn)研發(fā)工作,科大訊飛從發(fā)展過程中得到國家各方面支持,在2000年5月份的時(shí)候,科技部將科大訊飛認(rèn)定為國家語音技術(shù)成果唯一產(chǎn)業(yè)化的基地,在02年8月份國家發(fā)改委確認(rèn)科大訊飛作為國家語音的示范研究中心,03年10月份信息產(chǎn)業(yè)部正式確認(rèn)科大訊飛和國內(nèi)其他十幾家單位一起組建中文語音標(biāo)準(zhǔn)交互組,來制定中文語音的標(biāo)準(zhǔn),科大訊飛作為中間的標(biāo)準(zhǔn)。希望將國內(nèi)語音研究的優(yōu)勢和結(jié)果,和企業(yè)的標(biāo)準(zhǔn)逐漸形成國家的標(biāo)準(zhǔn),通過這個(gè)標(biāo)準(zhǔn)保護(hù)民族語音產(chǎn)業(yè)的發(fā)展。在03、04年科大訊飛被發(fā)改委信息產(chǎn)業(yè)部聯(lián)合確定國家語音產(chǎn)業(yè)唯一的國家規(guī)劃布局的重點(diǎn)軟件企業(yè)。這圖是當(dāng)時(shí)標(biāo)準(zhǔn)工作組成立的情況,今年第二次標(biāo)準(zhǔn)工作組已經(jīng)有了語音傳輸輸入輸出的標(biāo)準(zhǔn),F(xiàn)在語音技術(shù)除了剛才介紹的幾個(gè)典型應(yīng)用,已經(jīng)滲透很多領(lǐng)域,比如中國保險(xiǎn)業(yè)第一個(gè)總部級(jí)呼叫中心,比如中國首批建設(shè)的大銀行,比如工商銀行全國布點(diǎn),招商銀行光大,以及省級(jí)電話銀行,包含電信第一個(gè)上海語音門戶,全國14多個(gè)省份開通 電力自助式自序,這次十運(yùn)會(huì)語音是由科大訊飛和華為共同承擔(dān)的,現(xiàn)在科大訊飛語音技術(shù)已經(jīng)滲透到社會(huì)生活各個(gè)方方面面。
下面介紹一下TTS技術(shù)在銀行業(yè)的典型應(yīng)用和怎么應(yīng)用的,除了剛才介紹的工行應(yīng)用,在2004年5月份,廣大銀行在全國23個(gè)城市超過1千線呼叫中心采用TTS,廣大所有語音播報(bào)都是通過TTS技術(shù)實(shí)現(xiàn)的,此外在2003年的7月份深發(fā)展在全國14個(gè)城市呼叫中心統(tǒng)一使用了語音合成技術(shù),因?yàn)槭褂们闆r非常好,已經(jīng)應(yīng)用對(duì)公,信貸消費(fèi)等很多業(yè)務(wù)中,所以先后擴(kuò)容過兩次。此外招商銀行在今年4月份經(jīng)過比較細(xì)致的考察已經(jīng)開始在全國電話銀行中通過語音合成技術(shù)提供自助式語音播報(bào)技術(shù),F(xiàn)在沒有進(jìn)行國家大集中建設(shè)的各個(gè)省分行,比如建設(shè)銀行山東、福建、云南。包括工商銀行的江蘇、山東,以及剛剛建設(shè)完北京交行,上海交行,都把TTS融入呼叫中心。此外金融系統(tǒng)其他的應(yīng)用就是證券,證券的應(yīng)用和銀行有不可分割的關(guān)系。比如動(dòng)態(tài)的股評(píng)信息,基金電話信息都可以提供呼叫中心提供服務(wù)。
為什么要把語音技術(shù)用到銀行呼叫中心去,首先可以豐富電話銀行服務(wù)的范圍,原來通過錄音的形式,有很多信息很難通過比較好的效果推送禮用戶,現(xiàn)在有了語音技術(shù)就可以,另外可以針對(duì)用戶個(gè)性化的服務(wù),比如用戶自己交易的信息,現(xiàn)在也可以方便播報(bào)給用戶,此外可以降低運(yùn)營的成本,原來需要通過銀行專家提供的服務(wù),大家經(jīng)常問的問題也可以通過語音的形式提供服務(wù)。
下面簡單介紹一下TT S技術(shù)在銀行中可以有哪些實(shí)實(shí)在在的應(yīng)用,當(dāng)時(shí)以招商銀行的應(yīng)用,比如帳戶查詢,轉(zhuǎn)帳查詢等應(yīng)用,呼叫中心在沒有應(yīng)用TTS之前這效果可能很難接受,另外在轉(zhuǎn)帳服務(wù),原來效果也是比較難接受的。經(jīng)過改造以后。其他包含自助交費(fèi),提供費(fèi)用的查詢提供更加豐富的內(nèi)容,包含提供交費(fèi)的結(jié)果進(jìn)行確認(rèn),比如電話號(hào)碼手機(jī)號(hào)碼身份證再次的確認(rèn),此外提供銀證轉(zhuǎn)行的信息,銀證通可以讓股民適時(shí)查詢動(dòng)態(tài)股評(píng)信息。另外國債買賣,外匯買賣,自助貸款都可以使用語音技術(shù)提高服務(wù)的效果和品質(zhì),另外一些公共信息服務(wù)系統(tǒng),比如業(yè)務(wù)咨詢服務(wù),存貸款利率,營業(yè)網(wǎng)點(diǎn)ATM機(jī)分布信息都可以通過電話查詢,而且動(dòng)態(tài)變化的時(shí)候,不像以前用戶非常麻煩得錄音,因?yàn)閿?shù)據(jù)庫關(guān)聯(lián)了語音,就可以動(dòng)態(tài)實(shí)時(shí)把變化以后的結(jié)果傳遞給用戶。
另外銀行跟我們探討各類存貸業(yè)務(wù),以及公告通知,銀行很多營銷類的服務(wù)都可以通過外播式的手段實(shí)現(xiàn),因此語音技術(shù)可以顯著增強(qiáng)電話銀行業(yè)務(wù)的主動(dòng)營銷和差異化營銷的能力,之前有很多不能做的事情,比如要通過網(wǎng)絡(luò)查詢現(xiàn)在可以通過語音形式來實(shí)現(xiàn)。
綜上認(rèn)為TTS可以拓寬服務(wù)范圍,可以提供豐富的信息和內(nèi)容,可以顯著提升語音的效果,之前通過一個(gè)字拼起來效果用戶聽了很難受,可能不愿意接受銀行電話的服務(wù),現(xiàn)在有了這服務(wù)可以覆蓋更多的領(lǐng)域,原來更多的人工服務(wù)可以交給電話銀行來做,這樣可以降低人工的成本和勞動(dòng)強(qiáng)度,此外除了和CRM結(jié)合可以通過外播服務(wù)可以增強(qiáng)銀行的營銷能力,今天介紹以語音合成技術(shù)為介紹,下一步語音與視頻的合成技術(shù),未來語音也會(huì)找一些視頻用上去,總體來講智能化專業(yè)服務(wù),貫穿電話銀行整個(gè)項(xiàng)目,可以顯著提高電話銀行服務(wù)的品質(zhì)。
今天我介紹就到這兒,謝謝大家!
騰訊財(cái)經(jīng)
相關(guān)鏈接: