Cogito的信號(hào)處理和機(jī)器學(xué)習(xí)主管JohnKane說(shuō),人工智能和語(yǔ)音終于達(dá)到了一個(gè)新的高度。
“這個(gè)行業(yè)正在經(jīng)歷重大的勝利,比如能夠準(zhǔn)確地從語(yǔ)音中識(shí)別文本,創(chuàng)造出聽(tīng)起來(lái)自然的計(jì)算機(jī)聲音。”他說(shuō):“新產(chǎn)品現(xiàn)在可以分析語(yǔ)言的非言語(yǔ)特征。言語(yǔ)中的許多意義來(lái)自于說(shuō)話的方式,而不僅僅是所說(shuō)的話。而語(yǔ)音技術(shù)讀取和分析這些特征的能力是該行業(yè)向前邁出的一大步。”
Orbita首席執(zhí)行官Bill Rogers也同意這一觀點(diǎn)。
“如今的機(jī)器學(xué)習(xí)算法可以預(yù)測(cè)并提出建議,從而實(shí)現(xiàn)與人類(lèi)水平的自動(dòng)對(duì)話。這方面的高級(jí)應(yīng)用包括結(jié)合生物標(biāo)記來(lái)理解人類(lèi)的情緒,并從語(yǔ)調(diào)模式和基于語(yǔ)音識(shí)別的用戶(hù)識(shí)別中得出結(jié)論,”他解釋道。
其他人也同意,后一點(diǎn)尤為重要。
“在同理心和同情心對(duì)成功互動(dòng)至關(guān)重要的時(shí)代,語(yǔ)音技術(shù)的門(mén)檻已經(jīng)提高,”Interactions的研究與創(chuàng)新總監(jiān)Michael Johnston堅(jiān)持說(shuō)。“現(xiàn)代人工智能系統(tǒng)不僅提供日常自動(dòng)化,而且已經(jīng)開(kāi)始依靠客戶(hù)和座席之間的對(duì)話,并以許多新的方式增加價(jià)值,例如提供個(gè)性化建議和呈現(xiàn)相關(guān)信息和內(nèi)容。”
最新的統(tǒng)計(jì)數(shù)據(jù)強(qiáng)調(diào)了語(yǔ)音和人工智能的重要性:
- Allied Market Research預(yù)計(jì),未來(lái)7年,全球虛擬助理市場(chǎng)將增長(zhǎng)37.7%,到2027年將達(dá)到443億美元。
- 根據(jù)insightSLICE的數(shù)據(jù),到2030年,全球語(yǔ)音和語(yǔ)音識(shí)別市場(chǎng)預(yù)計(jì)將達(dá)到430億美元。
- 據(jù)谷歌統(tǒng)計(jì),全球27%的在線用戶(hù)使用語(yǔ)音搜索;eMarketer顯示,幾乎40%的美國(guó)互聯(lián)網(wǎng)用戶(hù)和三分之一的總?cè)丝谑褂谜Z(yǔ)音;據(jù)Perficient統(tǒng)計(jì),目前55%的智能手機(jī)用戶(hù)使用語(yǔ)音搜索。
- 根據(jù)New Vantage的研究,10家企業(yè)中有9家以上正在對(duì)人工智能進(jìn)行投資。
年度回顧
如果不優(yōu)先考慮COVID-19以及它如何迫使人工智能迎接挑戰(zhàn),就不可能評(píng)估2020年。
毫不奇怪,冠狀病毒是人工智能采用和語(yǔ)音技術(shù)創(chuàng)新的主要催化劑。廣泛的社會(huì)隔離以及對(duì)遠(yuǎn)程通信和連接的需求將會(huì)話人工智能推向了中心舞臺(tái),“Rogers說(shuō)。
例如:傳統(tǒng)的聯(lián)絡(luò)中心越來(lái)越多地轉(zhuǎn)向?qū)υ捠饺斯ぶ悄,以確保業(yè)務(wù)連續(xù)性。
Johnston說(shuō):“在一個(gè)充滿(mǎn)不確定性和混亂的時(shí)代,為客戶(hù)提供一致、有效服務(wù)的能力可能比以往任何時(shí)候都更為重要。”
醫(yī)療保健組織和提供者也令人印象深刻地采用人工智能和語(yǔ)音技術(shù)來(lái)清除冠狀病毒的障礙。
Just AI首席執(zhí)行官兼創(chuàng)始人Kiril lPetrov說(shuō):“以人工智能為動(dòng)力的聊天機(jī)器人和虛擬助理站在對(duì)抗COVID的最前線,幫助篩選和分類(lèi)患者、進(jìn)行調(diào)查、共享信息,并在人們無(wú)法離開(kāi)家的時(shí)候?qū)崿F(xiàn)遠(yuǎn)程醫(yī)療。”
使用語(yǔ)音分析和護(hù)理協(xié)調(diào)團(tuán)隊(duì),高;颊咭材軌蚋l繁地聯(lián)系,從而推動(dòng)實(shí)時(shí)數(shù)據(jù)和參與。
Cosán集團(tuán)創(chuàng)始人兼首席營(yíng)銷(xiāo)和發(fā)展官DavidHunt說(shuō):“隨著疫情的持續(xù),人們對(duì)心理健康的擔(dān)憂增加,人工智能技術(shù)已經(jīng)被用來(lái)提高患者的參與度,監(jiān)測(cè)心理健康的變化。”
總的來(lái)說(shuō),2020年讓商界領(lǐng)袖意識(shí)到,消費(fèi)者習(xí)慣將繼續(xù)快速演變。
“越來(lái)越多的公司認(rèn)識(shí)到,人工智能可以幫助應(yīng)對(duì)這些變化,繼續(xù)提供優(yōu)質(zhì)的客戶(hù)體驗(yàn),從而幫助公司與客戶(hù)建立更好的關(guān)系。”Read Speaker北美區(qū)總裁Matt Muldoon說(shuō):“公司已經(jīng)開(kāi)始利用人工智能開(kāi)發(fā)出更感性、更高質(zhì)量的聲音,品牌也使用了更多的交互式語(yǔ)音廣告,讓他們能夠直接與消費(fèi)者交談。”
2020年的其他亮點(diǎn)也很重要:
- 自動(dòng)語(yǔ)音識(shí)別通過(guò)不斷增加的遞歸神經(jīng)網(wǎng)絡(luò)傳感器的應(yīng)用,實(shí)現(xiàn)了又一個(gè)飛躍,從而提高了準(zhǔn)確性,減少了計(jì)算量。
- FacebookAI的wav2vec2.0吸引了大量的關(guān)注。Kane說(shuō):“wav2vec2.0是音頻和語(yǔ)音的一項(xiàng)創(chuàng)新,不需要自動(dòng)語(yǔ)音識(shí)別,它為下游的音頻和語(yǔ)音分類(lèi)任務(wù)提供了強(qiáng)大的原材料。”
- 引入OpenAI的GPT-3,以實(shí)現(xiàn)自然語(yǔ)言的預(yù)測(cè)和生成。
- 語(yǔ)音克隆得到改進(jìn),AI的本地化功能證明了這一點(diǎn)。“他們的合成語(yǔ)音克隆可以被訓(xùn)練說(shuō)六種語(yǔ)言。這項(xiàng)新功能允許將數(shù)字語(yǔ)音翻譯成其他語(yǔ)言,這將使本地化更加容易,”Petrov說(shuō)。
展望未來(lái)
業(yè)內(nèi)專(zhuān)家看好未來(lái)幾個(gè)月相關(guān)技術(shù)的快速擴(kuò)張。
“到2021年,我們將看到越來(lái)越多地使用會(huì)話人工智能來(lái)替代人類(lèi)智能的增強(qiáng)。”Johnston預(yù)測(cè):“我們還將見(jiàn)證對(duì)話人工智能從語(yǔ)音和文本渠道不斷擴(kuò)展到富媒體和多模式交互,智能虛擬助理將能夠通過(guò)語(yǔ)音和文本的視覺(jué)媒體組合向客戶(hù)呈現(xiàn)信息。”
Muldoon預(yù)測(cè),由于流感大流行而改變的消費(fèi)者習(xí)慣可能會(huì)加速人工智能和語(yǔ)音技術(shù)的應(yīng)用,特別是在今年上半年。
“我們將開(kāi)始看到支持語(yǔ)音的人工智能能力的擴(kuò)展。”他說(shuō):“隨著越來(lái)越多的模型繼續(xù)被構(gòu)建,將會(huì)有機(jī)會(huì)創(chuàng)造出更強(qiáng)大的交互,幾年后,人工智能將成為完成任務(wù)的第二種方式,而不是支持性角色。”
Kane預(yù)計(jì),由于無(wú)監(jiān)督的表征學(xué)習(xí),諸如聲音事件檢測(cè)和語(yǔ)音情感識(shí)別等分類(lèi)問(wèn)題的準(zhǔn)確率會(huì)有顯著的提高。
Kane說(shuō):“今年可能是交互式會(huì)話數(shù)據(jù)得到應(yīng)有的研究和開(kāi)發(fā)關(guān)注的一年,我們看到了更多關(guān)于交互式語(yǔ)音合成的學(xué)術(shù)研究,以幫助語(yǔ)音助理等強(qiáng)大應(yīng)用。”
其他人則希望,人工智能的進(jìn)步將在智能手機(jī)上帶來(lái)更好的語(yǔ)音文本轉(zhuǎn)換功能。
“現(xiàn)在,當(dāng)我們要求手機(jī)通過(guò)語(yǔ)音創(chuàng)建信息時(shí),我們會(huì)看到很多錯(cuò)誤。但隨著創(chuàng)新的繼續(xù)和算法的日益強(qiáng)大,我們將受益于這一應(yīng)用的準(zhǔn)確性提高,這也將影響智能說(shuō)話者擴(kuò)大他們對(duì)人類(lèi)語(yǔ)言的理解,以及更廣泛地與用戶(hù)交談的能力,”Rogers建議。
Wolters Kluwer的應(yīng)用數(shù)據(jù)科學(xué)主管John Langton認(rèn)為,我們可以預(yù)期,今年人工智能和其他技術(shù)(如面部識(shí)別和語(yǔ)音識(shí)別)之間的協(xié)同效應(yīng)將會(huì)增強(qiáng)。
“為了改進(jìn)整合,我們現(xiàn)在可以使用情感計(jì)算作為額外的信號(hào)到語(yǔ)音輸入,在回答消費(fèi)者問(wèn)題時(shí)推斷用戶(hù)意圖,”他說(shuō)。
許多人同意,人工智能也將繼續(xù)在醫(yī)療保健領(lǐng)域提供更好的患者護(hù)理服務(wù)。
“我們將觀察到為患者提供更加個(gè)性化的護(hù)理,為提供者提供更加高效和有效的手術(shù)。此外,遠(yuǎn)程醫(yī)療的迅速采用,加上消費(fèi)者對(duì)語(yǔ)音智能家居技術(shù)的廣泛使用,將可能推動(dòng)交流醫(yī)療AI機(jī)器人的發(fā)展,”Hunt說(shuō)。
聲明:版權(quán)所有 非合作媒體謝絕轉(zhuǎn)載
作者:Erik J.Martin
原文網(wǎng)址:https://www.speechtechmag.com/Articles/Editorial/Features/The-State-of-Artificial-Intelligence-145107.aspx