今天的報告主要分為四個部分,第一部分是呼叫中心面臨的挑戰(zhàn)和趨勢,第二部分是自然語言處理的重要性,第三部分是深度語義理解核心技術(shù),第四部分是深度語義理解的應(yīng)用。
首先來看呼叫中心面臨的挑戰(zhàn),我認(rèn)為呼叫中心的挑戰(zhàn)主要是關(guān)于人的三個矛盾,第一個矛盾是,我們知道呼叫中心的投入和規(guī)模每年都在持續(xù)的增長,這樣的話就需要招聘更多的人,但是我國的勞動力人口已經(jīng)在逐年下降越來越少,這樣就構(gòu)成第一個矛盾;第二個矛盾是,我們希望呼叫中心的人工座席團(tuán)隊(duì)盡可能的保持穩(wěn)定,但是事實(shí)上呼叫中心的離職率相對于別的行業(yè)來說始終處于一個比較高的水平;第三個矛盾,根據(jù)統(tǒng)計顯示呼叫中心的人力成本占到了總成本的82%,我們呼叫中心預(yù)算的增長的速度低于人力成本的增長速度,這樣就構(gòu)成了第三個矛盾。
這三個矛盾就使得智能化成為呼叫中心發(fā)展的一個必然趨勢,這里面我們可以從兩個角度來看。第一個角度就是機(jī)器可以替代人,也就是說我們不需要招更多的話務(wù)員。比如說智能客服、智能IVR、智能營業(yè)廳、智能外呼的應(yīng)用。Garter有一個報告,2020年智能機(jī)器人的座席能夠滿足40%的客服市場的需求,中國到時候就會有一千萬的智能機(jī)器人的座席;第二個角度來講的話就是說機(jī)器也可以輔助人、協(xié)助人,比如智能坐席助手和智能知識庫,我們可以提高座席人員的工作效率,讓同樣一個坐席人員可以去做更多的工作、去有更多的產(chǎn)出。
同時我們今天很高興的看到,就是說越來越多的用戶已經(jīng)開始適應(yīng)和習(xí)慣智能化的服務(wù)方式。國外報告是說在過去的2017年,已經(jīng)有超過15%的用戶有了跟智能機(jī)器人對話的經(jīng)歷,雖然說傳統(tǒng)的一些渠道,比如說電話、郵件的比例仍然遠(yuǎn)遠(yuǎn)高于對話機(jī)器人的比例,但是我們可以看到從趨勢上來講,就是智能服務(wù)的比例會占的越來越高。
在呼叫中心這個領(lǐng)域里面,智能服務(wù)、智能技術(shù)起作用的一個主要著力點(diǎn)就是語言的處理。語言的形式可能有語音、有文本。對于語音來講,通過語音識別的技術(shù),我們可以把它轉(zhuǎn)換成文本,所以說歸根到底可能主要還是一個文本處理的問題。這里面主要用到的就是自然語言處理的技術(shù),也就是NLP的技術(shù)。
我們可以看一看NLP在人工智能中的位置。人工智能可以劃分為三個層次,第一個就是計算智能,就是讓計算機(jī)具備能存會算的能力。第二個層次是感知智能,讓計算機(jī)能聽會說、能看會認(rèn),比如說語音識別、語音合成、人臉識別都屬于感知智能的范疇。第三個層次就是認(rèn)知智能,讓計算機(jī)具備能理解會思考的能力,NLP就是在研究如何讓機(jī)器人像人一樣去理解人類的語言,屬于認(rèn)知智能的范疇,著名的圖靈測試主要就是基于NLP的技術(shù)提出的。
在NLP的處理里面其實(shí)是面臨四個非常大的挑戰(zhàn)和困難。第一個是表達(dá)方式是非常靈活的,第二個是我們在語言當(dāng)中其實(shí)是普遍存在很多的不確定性,第三個是語言知識處理本身非常復(fù)雜,第四個是輸入可能是存在不規(guī)范性。比如講一個智能回訪的場景,我們都知道機(jī)器人做回訪,或者我們?nèi)斯ぷ龌卦L,往往第一個問題是身份的核對,比如“您好,請問你是張三先生嗎?”可能我們期望用戶說我是或者說我不是,這是非常簡單非常容易處理的;但是我們分析實(shí)際的錄音數(shù)據(jù),針對用戶表明自己就是張三,從表述上我們可以分為四類,第一類就是我剛才講的最簡單一個情況,第二類比如說用戶會說“有事趕緊說”,第三類他可能反問你,“你為什么午休時間給我打電話”,第四類,他甚至?xí)芙^你,“我現(xiàn)在不方便接電話”,但是后面這三類他都在變相的承認(rèn)自己是張三。我們就可以看到,其實(shí)對于一個簡單的身份核對,用戶就會有各種各樣非常靈活、非常多變的表達(dá)方式,要求我們能夠通過NLP的技術(shù)能夠去處理。
某種意義上來講就是一個問題它有多難,它就會有多重要。關(guān)于自然語言處理,微軟創(chuàng)始人比爾蓋茨很早之前就說過,自然語言處理是人工智能皇冠上的明珠。最近微軟的沈向洋博士提出了一個說法“懂語言者得天下”,就是強(qiáng)調(diào)人工智能接下來的突破就是在自然語言的理解。
我們看看NLP在實(shí)際中的應(yīng)用場景,可以劃分為三塊,第一塊就是通用領(lǐng)域,我們都知道搜索引擎、拼音輸入法,背后都是一些NLP的技術(shù)。第二塊是面對特定行業(yè)的應(yīng)用,比如說智能投顧、疾病診斷、還有教育、法律都有一些應(yīng)用場景,第三塊就是呼叫中心。
呼叫中心相對特殊,這個特殊性我認(rèn)為主要是因?yàn)樗膬蓚特點(diǎn)決定,第一個就是說各行各業(yè)都有這方面的需求,市場空間非常大;第二個特點(diǎn)是針對具體的客戶具體的行業(yè)來講,其實(shí)解決的是特定封閉領(lǐng)域的問題,這樣的話使得技術(shù)難度相對來講比較低。
接下來就是深度語義理解的核心技術(shù),對于NLP,從大的方面來看可以劃分為兩種技術(shù)路線,第一種是傳統(tǒng)的方法,基于符號的語義表示,在語義處理上是依賴于大量的規(guī)則還有淺層的分析,準(zhǔn)確率往往取決于你到底投入多少的人工,很難超過80%。第二種是深度語義理解的方法,基于分布式的語義表示,語義處理上是把傳統(tǒng)的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)去結(jié)合起來,另外在知識層面很好的利用知識圖譜作為支撐,準(zhǔn)確率可以做到95%以上。
深度語義理解有兩個要素,一個是關(guān)鍵算法,有語義相似度計算、語義復(fù)述、多意圖識別、自學(xué)習(xí);第二個是知識圖譜,從知識圖譜技術(shù)上來看是五方面的問題,第一個是知識的體系和表示,第二個是知識的建模,第三個是知識的獲取,第四個是知識的集成,第五個是知識的存儲和服務(wù)。下面我分別仔細(xì)介紹。
最終的話把算法和知識的所有技術(shù)整合起來,就構(gòu)成了我們的深度語義理解引擎,大概涉及到二十多種技術(shù)。
最后介紹一下我們在深度語義理解的具體的實(shí)踐和應(yīng)用。中興通訊的NGCC解決方案主要面向政企和運(yùn)營商市場,我們的解決方案具備三方面的特點(diǎn),第一個就是智能化,第二個是純云化、第三個是整體化。我們在中國平安、江蘇電信規(guī)模分別是15000座席和13400坐席,在建設(shè)銀行我們是兩地三中心12000坐席。這些案例都是呼叫中心少有的智能水平非常高、容量非常大,可靠性非常高的應(yīng)用案例,在這里面深度語義理解的技術(shù),應(yīng)用到了系統(tǒng)的各個部分,使得人工座席和機(jī)器可以密切的配合,有一個非常好的人機(jī)協(xié)作的效果。
最后總結(jié)下,中興通訊的NGCC解決方案,我們將深度語義理解的技術(shù)應(yīng)用到了系統(tǒng)的各個部分,具體來講有智能客服、智能IVR、智能營業(yè)廳、智能知識庫和智能外呼,這些智能的方案跟對于呼叫中心傳統(tǒng)功能的完全支持,一起構(gòu)成我們完整化的解決方案,我們希望通過以深度語義理解為代表的智能化技術(shù),把智能化與服務(wù)場景、接入渠道,還有業(yè)務(wù)系統(tǒng)做一個無縫的融合,希望在業(yè)務(wù)場景里面能夠給用戶提供舒適、無感、有效、快速的智能服務(wù)。謝謝大家。