什么是機(jī)器人工廠?
2016年開始,世界進(jìn)入“Chatbot時(shí)代”,科技行業(yè)巨頭也紛紛發(fā)布了各自在Chatbot領(lǐng)域的相關(guān)產(chǎn)品,例如蘋果Siri、微軟小冰、百度小度、阿里的天貓精靈等等。會(huì)話機(jī)器人的出現(xiàn)帶來的是用戶與計(jì)算機(jī)之間交互方式的變革,從以計(jì)算機(jī)為中心的一串有序的操作指令,發(fā)展到以用戶為中心的自然語言會(huì)話AI。
機(jī)器人工廠就是在“會(huì)話AIFirst”浪潮中應(yīng)運(yùn)而生的Chatbot智能機(jī)器人孵化平臺。有了機(jī)器人工廠,任何人只需一分鐘就可以搭建一個(gè)專屬的會(huì)話機(jī)器人,不懂NLP技術(shù)、搞不定編程各種問題都不存在的!
機(jī)器人工廠整體架構(gòu)圖如下所示,下面將圍繞產(chǎn)品場景和核心能力兩大塊做詳細(xì)介紹。
用于哪些產(chǎn)品場景?
機(jī)器人工廠的應(yīng)用場景主要分為答疑、運(yùn)營、運(yùn)維三大類。
- AI+智能答疑
答疑是三種場景中最常見的。用戶對商家的產(chǎn)品問詢、員工對企業(yè)的規(guī)章制度,總會(huì)有大量共性重復(fù)的問題需要解答,將這些共性的問題抽取出來整理成問答對沉淀在機(jī)器人工廠平臺上,答疑機(jī)器人就可以幫你解答大部分問題,既省時(shí)省力,就降低了人工成本。比如:機(jī)器人工廠為云棲大會(huì)提供了大會(huì)引導(dǎo)機(jī)器人。
- AI+內(nèi)容場景
運(yùn)營場景主要是通過機(jī)器人將消息準(zhǔn)確快速的統(tǒng)一觸達(dá)到所有用戶。比如,小明運(yùn)營著天南海北的100個(gè)商家群,只需機(jī)器人工廠一次配置消息內(nèi)容、發(fā)送時(shí)間,就可以準(zhǔn)時(shí)觸達(dá)100個(gè)商家群。輕松解決了人工操作100次的低效與時(shí)延。
- AI+日常運(yùn)維
運(yùn)維場景就更厲害了,機(jī)器人不僅會(huì)回答問題還能夠執(zhí)行命令。比如,你在阿里云上購買了一臺服務(wù)器,跑了一些任務(wù),可以讓機(jī)器人幫你查詢?nèi)蝿?wù)執(zhí)行的狀態(tài),發(fā)現(xiàn)異常,終止任務(wù)等等。“用戶提問—理解指令——調(diào)用服務(wù)(執(zhí)行指令)——返回答案”,是運(yùn)維場景的鏈路。
還有更多新奇的玩法兒,比如結(jié)合語音文字互轉(zhuǎn)技術(shù),與阿里云通信、菜鳥驛站一起打造了智能外呼機(jī)器人。調(diào)查問卷、電話回訪、上門服務(wù)確認(rèn)是否在家等等場景都可以由機(jī)器人完成,機(jī)器人一天可以打出的電話可是多了好幾倍。
有哪些核心能力?
介紹了這么多,你應(yīng)該對機(jī)器人工廠可以做什么有了一些基本認(rèn)識。下面將為你介紹機(jī)器人工廠有哪些核心能力,到底怎樣玩轉(zhuǎn)起來。
- 智能問答
智能會(huì)話機(jī)器人的看家本領(lǐng)就是QA問答。意圖和實(shí)體是兩個(gè)最基本的概念。意圖由用戶輸入、動(dòng)作、回應(yīng)三部分組成。其中用戶輸入定義了用戶問題;回應(yīng)定義了對應(yīng)的答案;動(dòng)作非必選,定義了理解用戶意圖后需要去執(zhí)行一系列指令。實(shí)體作用于用戶輸入,將用戶輸入中的結(jié)構(gòu)化信息抽取出來,高效地解決了存在大量類似意圖匹配場景的問題。例如,“杭州2020-03-08的天氣怎么樣?”杭州可以抽取成一個(gè)枚舉實(shí)體,2020-03-08可以抽取成一個(gè)正則實(shí)體,動(dòng)作可以定義為調(diào)用一個(gè)根據(jù)城市和時(shí)間去查詢天氣的服務(wù),最后回應(yīng)返回天氣信息。
上述例子說明,QA問答首先要做到對用戶意圖的精準(zhǔn)理解。機(jī)器人工廠底層有一套完備的算法框架,傳統(tǒng)機(jī)器學(xué)習(xí)算法與基于深度神經(jīng)網(wǎng)絡(luò)的自然語言處理算法相結(jié)合,離線的特征提取模型訓(xùn)練與在線的實(shí)時(shí)預(yù)測相結(jié)合,純文本的FAQ意圖匹配與基于實(shí)體槽位的意圖匹配相結(jié)合,從而提高意圖匹配的準(zhǔn)確率。這里不做詳細(xì)展開,后續(xù)會(huì)有專題文章介紹。
- 語料管理
會(huì)話機(jī)器人的智能程度在一定意義上取決于它所理解的語料的豐富性。但絕大部分的知識都是以非結(jié)構(gòu)化的文本形式沉淀下來,而非會(huì)話機(jī)器人所能理解的一問一答的意圖形式。因此,新創(chuàng)建的會(huì)話機(jī)器人怎樣快速構(gòu)建語料具有智能問答的能力?機(jī)器人工廠提供了三種方式解決冷啟動(dòng)問題,單個(gè)機(jī)器人應(yīng)用內(nèi),通過語料爬。ㄗ詣(dòng)化)與批量導(dǎo)入(人工)和預(yù)置意圖(系統(tǒng)公共語料)豐富語料;在多個(gè)應(yīng)用之間實(shí)現(xiàn)語料共享(應(yīng)用拼裝)。
- 語料爬取
語料爬取是指自動(dòng)地將用戶已有非結(jié)構(gòu)化的知識庫或文檔,通過機(jī)器閱讀和理解能力,抽取整理成會(huì)話機(jī)器人可以理解的問答對的形式。語料爬取不僅可以代替人工錄入快速豐富會(huì)話機(jī)器人的語料,而且極大的降低了知識庫對接機(jī)器人工廠的遷移成本。目前,機(jī)器人工廠平臺80%的語料都由語料爬取生成。此外,還支持人工的將excel或json格式的語料,批量導(dǎo)入自動(dòng)生成意圖。
- 預(yù)置意圖
預(yù)置意圖是機(jī)器人工廠將用戶高頻、通用的場景下沉到平臺層面,使其可以賦能所有平臺上的機(jī)器人應(yīng)用,增強(qiáng)QA問答能力。例如,閑聊、查詢天氣、查詢值班等等。用戶只需在平臺上勾選啟用,即可使自己的機(jī)器人擁有回答這些問題的能力。
- 語料共享
語料共享是指不同會(huì)話機(jī)器人之間相互復(fù)用語料的能力。例如,所有銀泰百貨的會(huì)員手冊都一致,但不同的店打折促銷活動(dòng)不同。機(jī)器人工廠支持將通用普適的語料創(chuàng)建一個(gè)機(jī)器人A,各自差異的語料分別創(chuàng)建各自的機(jī)器人,但大家都共享復(fù)用機(jī)器人A的語料。語料共享能夠提高語料的復(fù)用率,讓用戶更專注差異化的部分。
- 在線編程
上文提到過意圖是由“用戶輸入——動(dòng)作——回應(yīng)”三部分組成,其中動(dòng)作定義了理解用戶意圖后需要去執(zhí)行一系列指令。通常動(dòng)作會(huì)通過HTTP請求的方式去調(diào)用用戶自定義的一個(gè)服務(wù)。但發(fā)現(xiàn)經(jīng)常會(huì)遇到以下問題:
若用戶已有服務(wù)接口,會(huì)遇到服務(wù)格式不適配;機(jī)器人工廠的特殊處理邏輯與業(yè)務(wù)邏輯強(qiáng)耦合等問題。
若用戶沒有服務(wù)接口,需要開發(fā)、部署、聯(lián)調(diào)、發(fā)布一系列流程,還會(huì)遇到機(jī)器、網(wǎng)絡(luò)、環(huán)境等問題,如果線上驗(yàn)證失敗,上面步驟需要重新來過。
新增一些具有時(shí)效性的臨時(shí)功能,都需要牽一發(fā)而動(dòng)全身。
為了解決上述問題,機(jī)器人工廠與阿里云計(jì)算平臺的在線開發(fā)平臺AppStudio合作開發(fā)出基于AppStudio的在線服務(wù)開發(fā)IDE,為用戶提供云上在線編程平臺,幫助你打通下游的服務(wù)實(shí)現(xiàn)數(shù)據(jù)查詢,指令執(zhí)行,知識庫檢索,內(nèi)容推薦等功能?梢詾槟闾峁
- 靈活性:支持在線編程,自定義業(yè)務(wù)邏輯、安全性校驗(yàn)等,與業(yè)務(wù)系統(tǒng)本身解耦;
- 開放性:可以引入需要依賴的sdk,支持odps、hsf等服務(wù);
- 簡便性:封裝了基本類和openApi便于開發(fā);
- 即時(shí)性:不依賴任何發(fā)布系統(tǒng),隨改隨生效;
- 共享性:支持協(xié)同編輯開發(fā),代碼共享;
- 調(diào)試:支持在線debug、服務(wù)測試等功能;
未來已來
機(jī)器人工廠在阿里巴巴集團(tuán)內(nèi)經(jīng)過2年的發(fā)展與打磨,已經(jīng)孵化2w+機(jī)器人,服務(wù)44w+用戶。連續(xù)2年參加云棲大會(huì)讓我們感受到用戶對智能機(jī)器人的強(qiáng)烈訴求,2020年機(jī)器人工廠正式發(fā)布公有云版本。最后,獻(xiàn)上機(jī)器人工廠為飛天大數(shù)據(jù)開發(fā)平臺DataWorks打造的一鍵答疑機(jī)器人的Demo。