中文字幕无码久久精品,13—14同岁无码A片,99热门精品一区二区三区无码,菠萝菠萝蜜在线观看视频高清1

您當(dāng)前的位置是:  首頁 > 資訊 > 文章精選 >
 首頁 > 資訊 > 文章精選 >

標(biāo)貝科技CEO劉博:5G時代,如何打造“聲入人心”的AI語音交互體驗

2020-04-03 09:41:35   作者:   來源:騰訊5G生態(tài)計劃    評論:0  點擊:


  2020這個看似艱難的開年,事實上成為了數(shù)字化生活的加速助推器。
  5G已經(jīng)是人們眼前可見的未來,更美好的數(shù)字化場景觸手可及。在無論多艱難的環(huán)境里,我們希望從身邊每一個看似平凡的創(chuàng)新者身上,依然能看見光,依然能勇敢的去做一個追光者。
  5G作為全面“重造連接”的基石,所引發(fā)變革的廣度和深度,都將遠(yuǎn)超4G。在新的變革時代,改變世界,并不是大企業(yè)的專屬,它同樣屬于那些遍布不同行業(yè)的創(chuàng)新者。
  5G時代的序幕已經(jīng)拉開,騰訊5G生態(tài)計劃將與創(chuàng)新者同行,為追光者助力,實現(xiàn)“所見即未來”。
  通過「追光者-5G引領(lǐng)數(shù)字化」欄目,我們將邀請10個領(lǐng)域的5G創(chuàng)新者,講述他們的探索、行動、思考和預(yù)測,開啟5G引領(lǐng)下的數(shù)字化變革暢想。
  機(jī)器學(xué)習(xí)以及自然語言處理技術(shù)的進(jìn)步,開啟了基于先進(jìn)AI技術(shù)的人機(jī)語音交互,人們透過對話的方式獲取信息、與機(jī)器進(jìn)行交互,將不再只是存在科幻情結(jié)當(dāng)中。
  AI語音交互正在進(jìn)入每個人的日常生活,娛樂、工作、社交各個場景都已經(jīng)出現(xiàn)了“它”的身影。隨著5G翩然而至,高帶寬、低時延、廣連接“三大特性”將進(jìn)一步突破AI語音瓶頸,或許會給出更豐富的應(yīng)用場景和更完善的解決方案。
  本期「追光者-5G引領(lǐng)數(shù)字化」欄目,我們邀請到標(biāo)貝科技創(chuàng)始人兼CEO劉博,共同走進(jìn)智能語音的世界,一探5G時代的AI語音交互,將如何變化升級?哪些AI語音應(yīng)用場景將成為下一個風(fēng)口?
劉博
標(biāo)貝科技創(chuàng)始人兼CEO
  智能語音如何發(fā)展至今?
  回顧智能語音的發(fā)展歷程,大致分為五個階段。
  第一個階段是萌芽期,在1952年,貝爾實驗室研制出首個語音識別系統(tǒng)Audry,但當(dāng)時的語音識別系統(tǒng)非常粗糙,基本上停留在實驗室階段。
  第二個階段,在1984年,語音技術(shù)取得了真正的突破。IBM發(fā)布一款大詞匯量識別系統(tǒng),涵蓋5000多個詞匯,識別率達(dá)到95%。除此之外,美國卡內(nèi)基梅隆大學(xué)開發(fā)出一套名叫SPHINX的語音識別引擎,為后期語音識別技術(shù)走向商業(yè)化起到了重要的推動作用。
  第三個階段,我們將其定義為產(chǎn)業(yè)化階段。在1997年,第一款語音聽寫產(chǎn)品誕生了。2002年,美國啟動“全球自主語音”GALE項目,研發(fā)實時翻譯印刷品、網(wǎng)頁、新聞及電視廣播技術(shù)。2009年,微軟發(fā)布的Win7也集成了語音識別的功能。
  在第四個階段,語音技術(shù)迎來了快速應(yīng)用。蘋果推出首個語音助手Siri,谷歌相繼發(fā)布了首個手機(jī)語音搜素引擎GoogleNow。在技術(shù)具體落地的同時也解決了一些實際問題,比如2015年,我國誕生了首個可打斷糾錯的語音系統(tǒng),極大提升了語音交互體驗,對后續(xù)的應(yīng)用化落地起到很大作用。
  在第五個階段,我認(rèn)為是語音產(chǎn)品的爆發(fā)期。國內(nèi)我們能看到像騰訊、百度、小米、阿里等互聯(lián)網(wǎng)大廠,都推出了自家的智能語音產(chǎn)品。所以我相信,隨著AI語音識別應(yīng)用領(lǐng)域的不斷擴(kuò)展,我們的技術(shù)將獲得更多普及。
  與4G相比,5G將會對AI語音交互有哪些影響?
  4G連接了人與人,更強(qiáng)調(diào)以“人”為核心的交互過程。由于5G對邊緣計算和網(wǎng)絡(luò)切片能力的提升,未來會有更多設(shè)備接入5G網(wǎng)絡(luò),因此AI語音交互將經(jīng)歷從“人”到“人和設(shè)備”的核心轉(zhuǎn)變。那么5G將在哪些方面提升AI語音交互技術(shù)呢?
  首先,5G提升語音采樣率,打造更接近人聲的合成聲音。
  當(dāng)我們在打電話溝通交流時,經(jīng)常會產(chǎn)生很多問題。比如在電話中會發(fā)現(xiàn)對方的聲音可能不太友好,抑或是表達(dá)的意思不夠清晰。這也是為什么人們更喜歡面對面溝通重要的事情。
  在4G的時候,語音采樣率的指標(biāo)是16K,隨著5G不斷成熟應(yīng)用,語音采樣率將會提升至44K。兩者本質(zhì)上是信息密度傳輸?shù)膮^(qū)別。隨著采樣率的提升,語音將承載的交流信息會更強(qiáng),我們可以更多地感受到對方表達(dá)的意思和溫度。同時,可以獲取更保真、音質(zhì)更好的的效果,所以我們期待借助5G技術(shù),打造更接近人聲效果的合成語音。
  其次,5G提升泛在線設(shè)備能力,覆蓋連接更多設(shè)備,延展AI語音交互場景。
  盡管當(dāng)前的4G網(wǎng)絡(luò)每平方公里可以容納數(shù)千臺設(shè)備,但同樣范圍內(nèi)5G可以為百萬臺設(shè)備提供高速網(wǎng)絡(luò)連接。因此在5G時代,泛在線的能力將得到極大提升,當(dāng)設(shè)備接入5G網(wǎng)絡(luò)體系之后,更多應(yīng)用將融進(jìn)場景,形成交互的多元化應(yīng)用。隨著交互形態(tài)和交互能力提升,用戶的交互意愿將達(dá)到質(zhì)的變化。
  據(jù)艾瑞咨詢發(fā)布《2020中國智能物聯(lián)網(wǎng)AloT白皮書》顯示,至2025年,65%以上中國家庭擁有AI管家包括智能音箱、智能機(jī)器人、智能面板等形態(tài)的產(chǎn)品,且一戶家庭可以擁有10臺以上具備AI感知能力的設(shè)備,從而形成智能家居交互方式無感化。不僅僅是家居生活,未來的AI語音交互將轉(zhuǎn)向多場景切換、多交互形式,最終形成跨終端的無縫體驗。
  再者,5G豐富AI語音交互形式,向“千人千面”轉(zhuǎn)型。
  4G時代,由于帶寬壓力和計算能力限制,很多人機(jī)交互還停留在單一的語音對話形式,比如人機(jī)智能問答。但隨著5G基礎(chǔ)建設(shè)的不斷提升,人機(jī)交互將融入更多的AI技術(shù),包括手勢、人臉、視覺、語音等,形成多維度、多層次立體化的交互體系。
  記得之前很多人問我,語音是不是獨立存在的單個場景或板塊?其實不然。語音作為交互能力的基礎(chǔ),通過整合更多的場景形態(tài)和先進(jìn)技術(shù),打造沉浸式的交互體驗。在未來,我們可能將更多的技術(shù)融入相應(yīng)的設(shè)備里,形成多元化的產(chǎn)品體系。由于受限于4G速度,以前沒辦法真正做到語音交互的個性化、定制化、差異化,如今基于5G的特性,可以增加個性化定制的交互場景,實現(xiàn)“千人千面”的體驗。
  AI語音技術(shù)應(yīng)用在哪些重要的5G場景?
  5G+融媒體場景
  現(xiàn)在,視頻領(lǐng)域正成為大廠們競相追逐的熱點,因為內(nèi)容創(chuàng)造對于任何廠家而言都是瓶頸。但我們在做制作內(nèi)容的時候,通過5G與AI語音技術(shù)的結(jié)合,將大大提高產(chǎn)出效率。
  AI語音不僅能夠推動數(shù)字技術(shù)的內(nèi)容創(chuàng)作,還提高了媒體制作的效率。比如融媒體超高清視頻的制作主要分成三個部分:采集回傳、視頻素材的云端制作、最后形成高清視頻節(jié)目播出。5G+AI語音技術(shù)將整個“采-編-傳”的過程音頻化、高清化、云端化,極大解放了內(nèi)容創(chuàng)作者的雙手。
來源:IMT-2020(5G)推進(jìn)組5G新媒體行業(yè)白皮書
  5G+泛娛樂場景
  當(dāng)AI語音交互技術(shù)應(yīng)用在泛娛樂場景時,比如云游戲、高清視頻、VR、AR直播等等,將帶來更清晰的交互流程和更優(yōu)質(zhì)的交互體驗,實現(xiàn)定制化、智能化和場景化的高度滲透與融合。我觀察到云游戲的體驗形式正在發(fā)生本質(zhì)變化,市面上有部分廠商已經(jīng)實現(xiàn)了一些智能化體驗,游戲中的NPC(非玩家角色)可以直接跟用戶進(jìn)行對話和交流。
  5G+智慧生活
  5G重構(gòu)設(shè)備的連接方式,而AI語音讓設(shè)備自身、設(shè)備與設(shè)備之間更懂人,實現(xiàn)個性化的人機(jī)交互體驗,從萬物連接走向萬物智能。
  據(jù)相關(guān)白皮書指出,受益于城市端AIoT業(yè)務(wù)的規(guī)模化落地及邊緣計算的初步普及,2019年中國AIoT市場規(guī)模突破3000億大關(guān),直指4000億量級。由于AIoT在落地過程中需要重構(gòu)傳統(tǒng)產(chǎn)業(yè)價值鏈,未來幾年將會迎來較快的發(fā)展節(jié)奏,包括智能家居、車聯(lián)網(wǎng)、無人駕駛、智慧醫(yī)療等領(lǐng)域都將與AI語音交互緊密結(jié)合,從實驗室專有領(lǐng)域進(jìn)入尋常百姓的生活。
  隨著5G與AI語音交互的不斷融合,語音技術(shù)與場景結(jié)合度更加緊密,個性化語音交互是必然趨勢。我們希望把技術(shù)、情感與用戶串聯(lián)一起,將AI語音技術(shù)應(yīng)用到更多場景中,帶來“聲入人心”的語音交互體驗。
(掃描二維碼,觀看直播回放)
【免責(zé)聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

專題

CTI論壇會員企業(yè)