古有聽聲辨位,今有聽聲"識"人。說到聲音,其本質(zhì)是不同頻率聲音的集合,以波的形式振動(震動)傳播。由于每個人的發(fā)聲器官(口腔、鼻腔、聲帶)各不相同,因此每個人的聲音也不一樣。因而,你的聲音代表了個人很多關(guān)鍵信息,例如,性別、年齡、音色等特征。
前幾年,韓國大熱的刑偵劇《Voice》里,女主是一個報(bào)警中心電話接聽員,天生聽力過人,不僅能聽到很多常人聽不到的細(xì)小微弱的聲音,還能分辨出人講話的聲音、物體碰撞的聲音、環(huán)境背景音等,靠著這個聽聲辨物的"超能力",女主通過現(xiàn)場聲音,準(zhǔn)確的分辨人、物、地點(diǎn),幫助組員破獲了很多案件和解救人質(zhì)。
如今,這種通過解讀聲音來識人辨物,已經(jīng)完全能靠人工智能來實(shí)現(xiàn)了,即眾所周知的聲音識別。
在我們?nèi)粘I町?dāng)中,聲音識別已經(jīng)應(yīng)用得非常廣泛了。比如說我們平時(shí)使用一些智能家居設(shè)備時(shí),通過語音進(jìn)行指令操控;在不方便進(jìn)行手動輸入的場景下,可以通過語音輸入,進(jìn)行網(wǎng)頁搜索、導(dǎo)航設(shè)定、文本錄入,動嘴不動手,方便快捷。
但僅僅是這樣還不夠。在實(shí)際的應(yīng)用場景里,用戶的說話環(huán)境往往包含各種各樣的噪聲,會在一定程度上污染說話人的聲音信號,使算法無法準(zhǔn)確獲取說話人的聲紋特征;甚至由于說話人過多,無法準(zhǔn)確分離出目標(biāo)人的聲音,提取不到準(zhǔn)確的聲紋特征等因素,都會對識別效果有影響。
標(biāo)貝科技立足于對AI的理解,依托先進(jìn)的語音交互技術(shù),以語言和語音為入口,持續(xù)研發(fā)全新的AI語音能力,打造更懂用戶的語音服務(wù)和更接地氣的語音產(chǎn)品,目前已經(jīng)推出中英文語音識別、多語種語音合成、聲音轉(zhuǎn)換和聲紋識別服務(wù),均得到落地應(yīng)用。與此同時(shí),標(biāo)貝科技持續(xù)深挖細(xì)分領(lǐng)域,全新上線聲音理解功能,不僅能聽懂用戶說什么,還能鑒定用戶身份。
標(biāo)貝科技聲音理解,即通過聲音識別基本算法,自動對說話人的語音信號進(jìn)行特征提取,構(gòu)建聲音分析框架,由機(jī)器進(jìn)行語音數(shù)據(jù)分析,快速區(qū)分噪音與人聲,并判定發(fā)音人性別和年齡段,進(jìn)行更加精準(zhǔn)化的信息匹配。
在應(yīng)用場景上,聲音理解功能尤為有意義。在人機(jī)交互系統(tǒng)中,可以通過說話人的性別和年齡確定說話人所屬的特定人群,從而更有針對性的進(jìn)行交互。
在智能家居領(lǐng)域,智能音箱、智能語音助手可以利用聲音理解的"辨認(rèn)"技術(shù),得出其性別、年齡、歷史偏好等信息,提供個性化服務(wù),如針對老年人、兒童等年齡段用戶,按照興趣推薦不同的歌曲、新聞,對設(shè)備控制權(quán)限進(jìn)行安全控制,讓機(jī)器更智能。
在智能客服場景里,基于語義的自動電話銷售已經(jīng)成為行業(yè)常態(tài),而通過聲音理解功能對語音客服的音頻數(shù)據(jù)進(jìn)行分析,構(gòu)造實(shí)時(shí)準(zhǔn)確的用戶畫像,能做到對不同電銷客戶的精準(zhǔn)推送,大大降低獲客成本,提升用戶活躍度,增強(qiáng)變現(xiàn)能力。
在刑事偵查中,警方可以根據(jù)用戶的年齡和性別進(jìn)行訪問授權(quán),快速確定說話人的性別和年齡,有助于縮小搜索范圍,并為分析犯罪心理和行為分析提供依據(jù)。
總的來說,聲音作為人們進(jìn)行信息交流最方便、有效的方式,未來必然也是人機(jī)交互的不可或缺的載體。隨著多種語音交互技術(shù)的不斷成熟和融合,語音交互越來越多的轉(zhuǎn)向個性化需求,結(jié)合語音識別、聲紋識別等多元技術(shù),聲音理解能力將逐漸融入人們的日常生活,產(chǎn)生巨大的應(yīng)用價(jià)值。標(biāo)貝科技也將持續(xù)推動AI語音技術(shù)創(chuàng)新研發(fā),助力企業(yè)與開發(fā)者實(shí)現(xiàn)更多個性化語音解決方案的落地。
標(biāo)貝科技【聲音理解】服務(wù)已于12月16日在標(biāo)貝科技官網(wǎng)與標(biāo)貝開放平臺同步上線公測,免費(fèi)體驗(yàn)地址:
(1)標(biāo)貝科技官網(wǎng):https://www.data-baker.com/
(2)標(biāo)貝開放平臺:https://ai.data-baker.com/#/index?source=gzh001