看官們先不必驚訝或是失落,盡管這公眾號停更1個月后第一篇居然是講翻譯!!
先別急,我給你講個小笑話。
話說十年前,我有位朋友在巴基斯坦海外常駐工作,他老婆前往巴基斯坦去探親。回國之前總要陪著老婆上街買點當?shù)氐募o念品,而當?shù)刈畛雒目赡芫褪茄蛎毫。作為外語學院的英文老師,他老婆用標準的英文詢問巴基斯坦小販羊毛洗了之后會不會縮水,Shrink?可惜小販雖然會英文居然也聽不懂,我朋友急了,抓著毛毯拿到小販身前吼一句:After water,short or long?
您猜怎么著,小販似乎明白了!
我翻譯一下,我那哥們想說的應該是:過水了之后,變長還是變短...
語言是讓人懂的技術,當然能讓別人懂有很多種方法,翻譯最為關鍵!這個笑話作為我的保留段子曲目近十年一直在使用,直到最近讀到幾本人工智能的書引發(fā)了我的深思:原來語言翻譯是人工智能領域里的墮落街傳奇!(ps,墮落街這部美劇也不錯)。
語言翻譯在AI領域屬于自然語言處理NLP的范疇,最早可以追溯到人工智能這個詞還沒被發(fā)明出來的時候,1953年IBM就開始了第一次的機器翻譯,早期的機器翻譯進展緩慢,究其原因是采用的方法路線有偏差。老科學家們認為語言處理應該有相應的句法結構,使用句法分析和語義分析對每一個句子構建語法分析樹,通過由人工來編寫這些語法或者說文法原則的方式來進行理解式翻譯。這和當年人類開始研發(fā)飛機時走“鳥飛派”的路數(shù)是一樣的,但是他們確實也飛起來了,一直讓我嘆為觀止的聊天機器人ELIZA就是那個年代的產(chǎn)物,其智慧程度比起現(xiàn)在各種機器人都不遜色。
當然,鳥飛派是競爭不過動力派的。
但是,我確實很喜歡ELIZA,心靈對話大神一樣的機器人!
戰(zhàn)斗民族數(shù)學家馬爾可夫的概率模型為背景的統(tǒng)計方法結合海量的數(shù)據(jù)可以有效并且準確地翻譯。2016年谷歌發(fā)布神經(jīng)機器翻譯系統(tǒng),再次大幅度提高機器翻譯的水平,谷歌使用了循環(huán)神經(jīng)網(wǎng)絡RNN。與此同時facebook進一步提高了翻譯效率,用他們自己擅長的卷積神經(jīng)網(wǎng)絡CNN。也許有人會質疑,這種翻譯算理解嗎?能夠做到信達雅嗎?不過也許翻譯根本就不是理解的問題,翻譯本身并不需要解釋,翻譯只是翻譯,只是數(shù)據(jù)問題而不是語義問題。
說到這里就不得不提今天的廣告了:
用一句時髦的話說就是Genesys助力中國企業(yè)走出去!
大國崛起和全球化貿(mào)易的背景下,中國企業(yè)如何走出海外向更多的客戶銷售更多的產(chǎn)品和服務?
如何快速適應當?shù)氐谋镜鼗枨蟛⑶以诔杀竞托噬线_到完美的平衡?
Genesys提出了人工翻譯機器人對接方案:Kate the translator。
當海外的客戶點擊中國企業(yè)的海外網(wǎng)站選擇網(wǎng)頁聊天時,無論客戶輸入的是哪一種語言,都可以通過對接翻譯機器人的方式轉換成標準的中文,方便讓國內(nèi)的客服中心中文坐席為其服務,更贊的是,中文坐席不需要學習英文或者法語,直接輸入原生中文通過對接翻譯機器人直接轉換成對方的語言,構建了一種多語言客戶服務的巴別塔!尤其在中國企業(yè)海外走出去早期,在當?shù)卮罱ó數(shù)卣Z言坐席的條件還不具備的情況下,避免了匆忙在海外建站的高昂成本。
當然,還是要說一下技術原理的,如上的圖例我們使用了Microsoft的Translate API,當客戶點擊Webchat后可由系統(tǒng)路由或者坐席作出判斷決定是否需要引入翻譯服務,通過Kate系統(tǒng)對接了微軟的翻譯服務加入到文本聊天中來。
需要說明的是,
理論上只要任何一家網(wǎng)絡公司提供的Translate服務的API都是可以進行對接的。
在這里我要非常感謝兩本書:
吳軍博士的《數(shù)學之美》和尼克的《人工智能簡史》
今天的分享到這里,下一篇文章就跟大家正兒八經(jīng)地聊聊翻譯。