中文字幕无码久久精品,13—14同岁无码A片,99热门精品一区二区三区无码,菠萝菠萝蜜在线观看视频高清1

您當前的位置是:  首頁 > 資訊 > 文章精選 >
 首頁 > 資訊 > 文章精選 >

人工智能情緒檢測的發(fā)展現(xiàn)狀

2022-09-05 09:09:40   作者:   來源:CTI論壇   評論:0  點擊:


  CTI論壇(ctiforum.com)9月5日消息(編譯/老秦): 隨著短短幾年的巨大技術(shù)進步,關于人工智能是否可以感知的爭論已經(jīng)走出了科幻小說和好萊塢的圈子,進入了世界各地大大小小的公司的董事會。商界領袖提出的真正問題是:人工智能情緒檢測是否準備好迎接黃金時代?
  毫無疑問,擁有可以識別人類情緒的人工智能可能對聯(lián)絡中心、營銷、銷售、招聘和許多其他業(yè)務功能有益,但我們真的希望機器解釋或取代人類互動嗎?我們相信他們能準確地做到這一點嗎?
  看起來是這樣。情緒檢測開始進入各種業(yè)務流程,研究公司 MarketsandMarkets 預測全球情緒檢測和識別市場將從今年的 236 億美元增長到 2027 年的 433 億美元,復合年增長率為 12.9%。
  MarketsandMarkets 的報告稱,這種預期的增長是由于對基于語音的情緒檢測系統(tǒng)分析情緒狀態(tài)和社交智能人工智能的需求不斷增長。這種需求的部分原因是對卓越運營的需求增加。但也有許多因素阻礙了越來越多的采用。主要問題之一是對所涉及的術(shù)語和技術(shù)缺乏明確性。
  術(shù)語"情緒檢測"和"情緒分析"經(jīng);Q使用,但也有區(qū)別。
  據(jù)基于 AI 的語音識別和聯(lián)絡中心解決方案提供商 Deepgram 的專家稱,情緒分析通常是基于文本的學習分類任務。它可能對單個句子、段落或整個文檔進行操作。 Deepgram 專家在最近的一篇博文中寫道,情緒分析有多種用途,包括分析客戶反饋、監(jiān)控社交媒體對話、跟蹤品牌聲譽、衡量公眾對某個主題或問題的看法以及評估客戶滿意度。
  另一方面,情緒檢測,有時也稱為情緒識別,通常依賴于音頻,使用語調(diào)、音量和速度等因素來確定說話者所感受到的情緒,根據(jù) Deepgram 的說法,通常編碼為幾個類別之一,如快樂、悲傷、生氣等。
  情緒檢測以簡單的分析技術(shù)無法提供的方式為客戶對公司的態(tài)度提供線索。
  "情感是我們所有人的一部分,"CallMiner 的人工智能副總裁 Rick Britt 說。 "我們都會感到憤怒和沮喪,快樂和幸福。但我們也以不同的方式分享這些情緒。例如,有些人在生氣時會變得非常安靜和輕聲細語,而不是大聲而快速地說話。眾所周知,檢測和理解情緒很困難。"
  Britt 補充說,了解客戶對話中的情緒,例如客戶是否對公司或產(chǎn)品感到沮喪或滿意,對于面向客戶的組織來說非常有用。 "雖然檢測情緒對機器來說很困難,就像對人類一樣,但深度學習的進步正在幫助公司識別客戶在互動中表現(xiàn)出廣泛情緒的方式。"
  Britt 說,另一個使問題復雜化的事實是,情緒對于他們所參與的個人和組織來說都是獨一無二的。每個人都有個人情感基線,可能是情境性的?蛻粼谂c收債員互動時表現(xiàn)出的情緒反應與跟電子零售商互動時表現(xiàn)出的情緒反應大不相同。
  "當組織能夠有效和準確地理解情緒時,他們可以更好地對客戶對話中發(fā)生的事情采取行動," Britt 說。 "這可以包括幫助聯(lián)絡中心或客戶服務座席更好地處理情感互動,例如當他們可能與需要額外照顧和同情的弱勢客戶互動時;蛘吡私饪蛻粼趯υ捚陂g的情緒,以便他們可以查明如何將開始為消極而結(jié)束為積極的互動所采取的成功步驟。這些見解可以推動更好的座席入職和指導工作。"
  這種能力對于聯(lián)絡中心很重要,因為當組織可以在對話中檢測到情緒時,他們可以在問題成為真正問題之前發(fā)現(xiàn)問題,為座席提供更多數(shù)據(jù)驅(qū)動的績效反饋,從過去的交互中學習以改善未來的客戶結(jié)果等等,Britt 說。
  "人類交流很復雜,包含語言和非語言元素,"Outreach 的高級應用科學家 Kushal Lakhotia 補充道。 "情感是人類表達自我的重要非語言成分。它通過音頻和視覺提示來傳達,例如語音和面部表情中的語調(diào)。情緒識別技術(shù)提取語音識別的互補信號,從而有助于充分了解一個人試圖交流的內(nèi)容。"
  Lakhotia 表示,此類數(shù)據(jù)在對話智能應用程序中特別有用,它可以總結(jié)對話的要點,這些要點需要更深入地理解一個人所說的話之外的信息。
  語言學是最好的情緒檢測器
  然而,Verint 的語音和文本分析市場副總裁 D. Daniel Ziv 反駁說,即使 Verint 和其他公司提供的技術(shù)可以識別音量、提高說話速度以及類似的客戶滿意度或情緒指標,對公司和特定互動的不滿意,實際使用的詞語比其他指標更能反映客戶的感受。
  "并不是所有的臟話都有四個字母,有些詞自然而然地比其他詞帶有更多的情感,"Ziv 解釋說。 "我們可以統(tǒng)計識別哪些詞帶有更多的情感。因為我們現(xiàn)在的轉(zhuǎn)錄非常準確,與使用音調(diào)、音高、速度和其他可以傳遞情感的東西相比,這往往會產(chǎn)生非常準確的結(jié)果。"
  Ziv 補充道:"如果我非常生氣,而且我沒有說過一個生氣的話,但 [滿意度評分] 僅基于語氣,那么很有可能是誤報。背景中可能有一個嬰兒在哭泣,我可能是從嘈雜的公共汽車或機場打來的。我們做了很多測試,發(fā)現(xiàn)使用基于語言的情感和一些基于聲學的證據(jù)更準確。"
  根據(jù) Ziv 的說法,串擾--當客戶與座席交談時,反之亦然--是真實情緒的另一個強有力的指標,談話中長時間的沉默或間隙也是如此。 "我們已經(jīng)測試了五種不同類型的算法,它們使用聲學分析進行情緒檢測。純聲學是非常不準確的。僅語言非常準確,而且比以前更準確,因為我們的轉(zhuǎn)錄現(xiàn)在更準確,"他說。
  Ziv 說,聯(lián)絡中心客戶越來越多地尋求情緒檢測分數(shù),因為他們想要情緒分析并希望取代調(diào)查,以便他們可以自動覆蓋 100% 的交互,而不是只覆蓋包括已完成關注在內(nèi)的一小部分客戶交互情緒調(diào)查。
  更好的情緒預測器
  據(jù) Ziv 稱,情緒檢測功能在聯(lián)絡中心變得越來越流行,因為它們比凈推薦值更能真實地反映客戶情緒。他說,獲取 NPS 數(shù)據(jù)需要客戶付出努力,其中許多人只是不想被打擾。 "客戶厭倦了 [NPS 調(diào)查],因為他們受到了轟炸。因此,響應率有所下降。"
  Ziv 補充說,即使客戶確實做出了回應,NPS 調(diào)查也沒有詳細說明客戶為什么會推薦或不會推薦一家公司。 "這沒什么幫助。它有助于識別趨勢,但并不能真正幫助解決問題。因此,轉(zhuǎn)變是使用我們從客戶那里獲得的實際信息。"
  Ziv 進一步解釋說,公司希望從通過語音和文本交互顯示的情緒以及圍繞這些交互的上下文中提取真實的客戶情緒。 "所以現(xiàn)在我們對推動情緒高漲和低迷的原因有了更豐富的了解。"
  Lakhotia 表示,雖然過去幾年解決方案變得更加準確,但這只是情緒檢測方面的最新進展之一。
  "口語情感識別是一個專注于副語言學的研究領域,與自動語音識別不同,它需要捕捉語音的韻律元素,"Lakhotia 解釋說。 "該領域的研究專注于設計特定的模型來捕捉可以被訓練來檢測情緒的韻律。然而,隨著在語音中使用神經(jīng)網(wǎng)絡進行自我監(jiān)督學習的發(fā)展,該領域已經(jīng)從專業(yè)模型轉(zhuǎn)向通用模型。"
  Lakhotia 補充說,自我監(jiān)督學習可以使用大量未標記的數(shù)據(jù)來訓練可以從語音中提取信號的模型。這些模型通常經(jīng)過數(shù)千小時的語音訓練,然后這些預訓練模型可以適應一系列口語任務,而標記的任務特定數(shù)據(jù)要少得多。
  "一些流行的 SSL 模型在過去幾年中被廣泛用于多項口語任務,包括 CPC、wav2vec 2.0 和 HuBERT,"Lakhotia 說。 "這反過來又導致了 SUPERB、HEAR 和 LeBenchmark 等標準化基準的引入,這些基準通過引入一種一致的方式來比較多個 SSL 模型對一系列任務(包括口語情感識別)進行比較,從而幫助推動了該領域的發(fā)展。"
  Lakhotia 表示,雖然口語情感識別是一個活躍的研究領域,但用于它的數(shù)據(jù)集是更廣泛的多模式數(shù)據(jù)集的子集,例如 IEMOCAP、CREMA-D 和 RAVDESS,其中包括聲音數(shù)據(jù)和面部表情。此類數(shù)據(jù)集的存在正在推動超越語音并結(jié)合視聽信號的多模態(tài)情感識別研究。
  流失檢測
  據(jù) Ziv 稱,一些公司,尤其是那些流失率高的公司,希望情緒檢測能夠為座席提供強大的實時指標,以表明特定客戶可能會流失,而不是僅僅對去競爭對手發(fā)表無意義的評論。
  "在客戶流失方面,你必須考慮其他因素,"Ziv 說,并指出很多時候客戶對產(chǎn)品表現(xiàn)出的挫敗感可能與銷售該產(chǎn)品的公司無關。
  在某些行業(yè),尤其是電信和保險行業(yè),合同期結(jié)束時客戶流失率可能非常高。
  "添加尋找有風險客戶的語音類別通常會顯著改善這些客戶流失模型,"Ziv 堅持說。 "它的準確程度因客戶而異。但我們已經(jīng)看到超過 90% 的準確率,而且我們有時看到客戶流失率從 50% 提高到 70%,這很重要。"
  Ziv 指出,雖然它可以作為流失率的一個很好的指標,但其他因素,例如其他供應商的可用性,也會影響流失率。這在電視領域尤為常見,因為大多數(shù)地方只有一個有線電視提供商。雖然也可能有衛(wèi)星互聯(lián)網(wǎng)提供商,但現(xiàn)實情況是,在這種情況下沮喪的客戶可能別無選擇。
  在對計算機情感檢測猶豫不決的其他原因中,有些人認為現(xiàn)有的一些情感檢測解決方案,特別是那些包括面部識別技術(shù)的解決方案,可能過于個人化。
  DeepMedia.AI 的創(chuàng)始人兼首席執(zhí)行官 Rijul Gupta 表示,情感技術(shù)必須避免由于當前許多機器學習系統(tǒng)的情感無知而導致的非人性化。 "目前在谷歌翻譯(技術(shù)正確但缺乏情感)、TikTok Voice(聽起來很機器人)的狀態(tài)下可以看到無靈魂的技術(shù)。這些系統(tǒng)中缺乏根深蒂固的情緒檢測不會產(chǎn)生消費者的喜悅甚至接受。"
  據(jù)報道,Zoom Video Communications 開始探索情緒檢測技術(shù),這引起了超過 28 個人權(quán)組織的憤怒。他們敦促 Zoom 停止其在情緒跟蹤系統(tǒng)上的工作,該系統(tǒng)旨在分析用戶的參與度和情緒。
  許多行業(yè)專家預計,隱私問題在未來幾年內(nèi)將十分突出。但與此同時,對技術(shù)的需求將會增長,正如 MarketsandMarkets 預測所證明的那樣,技術(shù)本身將繼續(xù)發(fā)展。
  "在過去幾年中,在構(gòu)建可以從視聽輸入中聯(lián)合提取信號的自我監(jiān)督模型方面取得了重大進展,"Lakhotia 說。 "這使得能夠使用單個模型對語音和視覺輸入進行建模。多模態(tài)建模的發(fā)展與用于進行實驗的高質(zhì)量視聽數(shù)據(jù)集的存在相結(jié)合,將推動該領域超越口語情感識別,并為情感識別建立新的最新成果。"
  Ziv 說,公司將繼續(xù)使用情緒檢測來幫助推動他們的客戶心聲工作。 "我認為我們會看到更多針對它采取行動的獨特案例,其背后的算法也會有所發(fā)展。"
  然而,Ziv 說,除了算法或情緒評分之外,公司最重要的好處將是能夠使用分析實時采取行動,而不是等到交互發(fā)生之后。
  聲明:版權(quán)所有 非合作媒體謝絕轉(zhuǎn)載
  作者:Phillip Britt
  原文網(wǎng)址:https://www.speechtechmag.com/Articles/Editorial/Features/Interest-Mounts-for-Emotion-Detection-153969.aspx
【免責聲明】本文僅代表作者本人觀點,與CTI論壇無關。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

相關熱詞搜索: 情緒檢測

上一篇:Web3.0對語音技術(shù)的影響

下一篇:最后一頁

相關閱讀:

專題

CTI論壇會員企業(yè)