如何讓機(jī)器學(xué)會保持一個(gè)完整的對話始終是人工智慧界最困難的問題之一。因?yàn)槿粝肓私庖痪湓捇蛞欢挝淖值恼嬲饬x,機(jī)器(甚至人)需要對世界有一定程度的理解,它們需要「常識」。
如今,為了解決這一難題,Salesforce公司的研究人員們想出了一個(gè)妙招:在教一個(gè)演算法其他技能之前,先教它說第二種語言。
他們發(fā)現(xiàn),當(dāng)一個(gè)機(jī)器學(xué)習(xí)系統(tǒng)學(xué)會如何把一種語言翻譯成另外一種語言時(shí),它會自動學(xué)會單詞之間的關(guān)系。而若以這個(gè)系統(tǒng)為基礎(chǔ),再訓(xùn)練另外一個(gè)應(yīng)用時(shí)(比如對話,或察覺文字中的情緒),它的表現(xiàn)將遠(yuǎn)好于從零建立的系統(tǒng)。
Salesforce的首席科學(xué)家、機(jī)器學(xué)習(xí)專家Richard Socher對此表示:「我們所做的基本上就是把機(jī)器翻譯的數(shù)據(jù)拿來,去教一個(gè)模型如何理解單詞和情境!
有很多「機(jī)器學(xué)習(xí)的創(chuàng)新」可以用來提高機(jī)器人的語言能力,Salesforce的研究成果只是其中之一。正如許多基于深度學(xué)習(xí)的計(jì)算機(jī)視覺系統(tǒng)都會提前接受網(wǎng)路訓(xùn)練,Socher認(rèn)為,機(jī)器翻譯對自然語言系統(tǒng)的作用也是類似的。
作為一個(gè)集銷售、營銷以及客戶互動管理為一體的大型網(wǎng)路平臺,Salesforce已經(jīng)在其Einstein平臺中提供一系列的人工智慧工具。比如,一個(gè)可以對電郵和訊息中的情緒進(jìn)行自動分類的工具,以及一個(gè)根據(jù)員工之前的工作,自動對他需要追查的線索進(jìn)行優(yōu)化的工具。
Socher相信,他們這個(gè)發(fā)現(xiàn)將會提高Einstein平臺的自動語言能力,「對于聊天機(jī)器人和自動客服來說,它‘超級’有用。」
在測試中,研究人員首先需要訓(xùn)練一個(gè)深度學(xué)習(xí)系統(tǒng)在英語和德語之間進(jìn)行翻譯。為此,他們給一個(gè)多層神經(jīng)網(wǎng)路提供了大量已經(jīng)翻譯好的文件,并慢慢調(diào)試各種參數(shù),直至它可以自行產(chǎn)生不錯(cuò)的翻譯結(jié)果。
在學(xué)會翻譯之后,研究人員們就開始訓(xùn)練這個(gè)「雙語人工智慧」去學(xué)習(xí)更多的技能了,比如判斷一段文字背后的情緒,對各種問題進(jìn)行分類,以及回答問題。在對比測試中,經(jīng)過雙語訓(xùn)練的神經(jīng)網(wǎng)路的成績遠(yuǎn)好于沒有經(jīng)過雙語訓(xùn)練的系統(tǒng)。
由于機(jī)器翻譯已經(jīng)是一個(gè)成熟的領(lǐng)域,研究人員有大量的數(shù)據(jù)來進(jìn)行訓(xùn)練!阜g和語言的其他部分之間有著極其重要的關(guān)聯(lián),」Salesforce的研究員Bryan Mc Cann說道:「(翻譯數(shù)據(jù))一般涉及面非常廣,它們包含著各種對自動語言處理有用的信息!