AI技術(shù),是近年來(lái)最火熱的前沿技術(shù)之一。在企業(yè)通信領(lǐng)域,人工智能可以簡(jiǎn)化企業(yè)日常交流和協(xié)作的多個(gè)要素,這不僅可以提升員工對(duì)公司業(yè)務(wù)的參與度,而且可以提高協(xié)作效率和生產(chǎn)力。
本期「億聯(lián)大咖說(shuō)」,就帶你與億聯(lián)產(chǎn)品副總廖昀近距離接觸,了解他對(duì)AI技術(shù)在企業(yè)通信領(lǐng)域發(fā)展的前沿觀點(diǎn)。
億聯(lián)產(chǎn)品副總 廖昀
01小編:請(qǐng)問(wèn)廖總,最開(kāi)始是什么契機(jī)導(dǎo)致AI技術(shù)引入企業(yè)通信領(lǐng)域?
廖昀:AI人工智能本身是一種模擬、延伸和擴(kuò)展人類智能的一種技術(shù),本質(zhì)上是希望能通過(guò)這一技術(shù),讓計(jì)算機(jī)算法代替人完成數(shù)據(jù)的分析思考,然后進(jìn)行各類操作,改善和提升我們進(jìn)行各項(xiàng)活動(dòng)時(shí)的體驗(yàn)。企業(yè)通信領(lǐng)域引入人工智能也是基于這樣的目的,是用戶需求驅(qū)動(dòng)的結(jié)果。
語(yǔ)音、圖像等各類AI技術(shù)很好地解決了企業(yè)通信應(yīng)用中的一些用戶體驗(yàn)痛點(diǎn),當(dāng)我將這些技術(shù)應(yīng)用到日常通信場(chǎng)景中時(shí),我們發(fā)現(xiàn)這與我們一直倡導(dǎo)的“易用易部署”的產(chǎn)品設(shè)計(jì)理念不謀而合,也讓我們堅(jiān)定了要運(yùn)用AI技術(shù)升級(jí)企業(yè)通信方案的想法。
02小編:在企業(yè)通信領(lǐng)域,AI技術(shù)的發(fā)展涉及哪些技術(shù)領(lǐng)域?具體發(fā)展和應(yīng)用如何?
廖昀:在企業(yè)通信領(lǐng)域,契合用戶場(chǎng)景需求、能產(chǎn)生較大價(jià)值的AI技術(shù)主要包括語(yǔ)音識(shí)別、多語(yǔ)言翻譯、人臉和人體檢測(cè)識(shí)別等幾個(gè)方面。在通信系統(tǒng)或終端中,通過(guò)引入AI技術(shù),對(duì)改善人機(jī)交互體驗(yàn),提升溝通協(xié)作效率,以及簡(jiǎn)化會(huì)議內(nèi)容的跟進(jìn)處理,這些方面都存在很大的應(yīng)用價(jià)值。
目前業(yè)內(nèi)發(fā)展比較成熟,已經(jīng)得到普遍應(yīng)用或者正在落地的AI技術(shù)應(yīng)用主要有以下幾個(gè):
人像識(shí)別自動(dòng)取景及演講者跟蹤
這項(xiàng)功能主要體現(xiàn)在視頻會(huì)議過(guò)程中,集成人像檢測(cè)、聲源定位、語(yǔ)音追蹤等多項(xiàng)AI技術(shù),能根據(jù)參會(huì)人數(shù)與位置變化自動(dòng)調(diào)整畫面大小,呈現(xiàn)最佳取景。此外,還能實(shí)時(shí)檢測(cè)發(fā)言者位置,呈現(xiàn)特寫,免去手動(dòng)調(diào)節(jié)攝像機(jī)操作,像是有一個(gè)自動(dòng)導(dǎo)播員,讓與會(huì)人員更專注于會(huì)議內(nèi)容。
億聯(lián)終端自動(dòng)取景功能
基于人臉識(shí)別的參會(huì)人自動(dòng)識(shí)別或自動(dòng)簽到
在會(huì)議開(kāi)始前提前錄入人像及相關(guān)信息,在視頻會(huì)議中,系統(tǒng)若識(shí)別到與人像匹配的與會(huì)者,將自動(dòng)標(biāo)記相關(guān)信息,避免會(huì)議中詢問(wèn)或確認(rèn)對(duì)方名字和身份的尷尬,也可以進(jìn)行會(huì)議的自動(dòng)簽到,以及結(jié)合演講者跟蹤、語(yǔ)音識(shí)別技術(shù)實(shí)現(xiàn)按發(fā)言人分類的發(fā)言文字記錄功能。
智能語(yǔ)音增強(qiáng)
通過(guò)人工智能語(yǔ)音識(shí)別技術(shù),并利用麥克風(fēng)陣列的空間選擇性,對(duì)目標(biāo)說(shuō)話人語(yǔ)音進(jìn)行增強(qiáng),同時(shí)抑制或消除噪聲、混響等無(wú)效語(yǔ)音的干擾。
億聯(lián)話機(jī)“隔音罩”功能
實(shí)時(shí)語(yǔ)音轉(zhuǎn)寫及多語(yǔ)言翻譯
將發(fā)言語(yǔ)音實(shí)時(shí)轉(zhuǎn)寫為字幕,進(jìn)一步地可翻譯為多語(yǔ)言字幕,會(huì)后還可以將會(huì)議發(fā)言、音視頻直播內(nèi)容等音頻轉(zhuǎn)寫為文字,并進(jìn)行分類歸納整理為會(huì)議紀(jì)要。
虛擬場(chǎng)景、背景替換
當(dāng)前基于摳圖和背景虛化、背景替換的AI應(yīng)用得到了用戶的普遍喜愛(ài),這是一個(gè)很典型的用戶需求驅(qū)動(dòng)的應(yīng)用案例,既降低了會(huì)議過(guò)程中干擾,提升了溝通效率,又打破了用戶參與會(huì)議的地點(diǎn)場(chǎng)景限制。
這些AI應(yīng)用在億聯(lián)網(wǎng)絡(luò)推出的企業(yè)通信解決方案中,有些已經(jīng)得到了很好的應(yīng)用,有些正在完善中,即將在后續(xù)的版本中得到體現(xiàn)。未來(lái)的遠(yuǎn)程溝通協(xié)作體驗(yàn)將更加智能和高效。
03小編:未來(lái),還會(huì)有哪些AI功能陸續(xù)應(yīng)用在企業(yè)通信領(lǐng)域?
廖昀:企業(yè)通信領(lǐng)域近些年一直在AI技術(shù)應(yīng)用上不斷突破,始終圍繞提升溝通效率這一根本目的展開(kāi)。
下個(gè)階段,在語(yǔ)音識(shí)別方面,多語(yǔ)言翻譯將會(huì)是下一個(gè)存在巨大應(yīng)用潛力的AI技術(shù)。這項(xiàng)技術(shù)主要應(yīng)用于遠(yuǎn)程會(huì)議中跨語(yǔ)言的溝通交流,實(shí)時(shí)會(huì)議中的多語(yǔ)言翻譯對(duì)翻譯的準(zhǔn)確性和實(shí)時(shí)性要求很高,面臨著很大的挑戰(zhàn),目前這項(xiàng)技術(shù)在業(yè)內(nèi)還處于完善階段,還有不少問(wèn)題要解決或性能指標(biāo)的提升。
實(shí)時(shí)會(huì)議的多語(yǔ)言翻譯這項(xiàng)技術(shù)的落地應(yīng)用,需要平臺(tái)端和終端共同努力,在提升平臺(tái)端翻譯準(zhǔn)確度和實(shí)時(shí)性的同時(shí),終端也要提升前端采集的語(yǔ)音質(zhì)量。技術(shù)的進(jìn)步和發(fā)展常常超出我們的預(yù)期,現(xiàn)在的技術(shù)困難和障礙都將是暫時(shí)的,現(xiàn)在看似不可能的AI功能應(yīng)用,只要用戶有強(qiáng)烈的需求在驅(qū)動(dòng),未來(lái)終將得到實(shí)現(xiàn)和普及應(yīng)用。
億聯(lián)語(yǔ)音轉(zhuǎn)寫功能
在企業(yè)通信中,除了語(yǔ)音和圖像的基本AI應(yīng)用,提升遠(yuǎn)程溝通交流的效率,橫向地,也可以將這些AI技術(shù)與各類企業(yè)數(shù)據(jù)平臺(tái)打通,實(shí)現(xiàn)更智能、更高效的辦公協(xié)作體驗(yàn)。比如根據(jù)語(yǔ)音識(shí)別到的會(huì)議話題內(nèi)容,自動(dòng)調(diào)取各項(xiàng)業(yè)務(wù)流數(shù)據(jù),或者自動(dòng)對(duì)接和處理郵件、日歷、OA、項(xiàng)目管理等各項(xiàng)業(yè)務(wù)流程,就像是有一個(gè)全能型的會(huì)議秘書可以隨時(shí)幫你提供業(yè)務(wù)數(shù)據(jù)和內(nèi)容,并自動(dòng)跟進(jìn)會(huì)議的待跟蹤事項(xiàng),通過(guò)高效的數(shù)據(jù)分析和智能的業(yè)務(wù)判斷,讓我們的辦公和溝通協(xié)作非常地順暢。
未來(lái),億聯(lián)網(wǎng)絡(luò)將持續(xù)加碼AI智能在企業(yè)通信領(lǐng)域的應(yīng)用,讓我們的企業(yè)通信產(chǎn)品更加簡(jiǎn)便易用,為我們的用戶帶來(lái)更加智能的通信體驗(yàn)。我們也將始終關(guān)注AI技術(shù)的前沿應(yīng)用,分享未來(lái)人類便捷生活的美好圖景。