最近一段時間,捷通華聲在清華大學(xué)科技力量的支持下,以“眼見為實”的新穎發(fā)布方式,旋風(fēng)般相繼推出靈云遠(yuǎn)場語音識別、語音喚醒、聲源定向等關(guān)鍵技術(shù),引發(fā)了產(chǎn)業(yè)界的廣泛關(guān)注。12月16日捷通華聲宣布面向車載、家居、家電、機器人等領(lǐng)域推出完整的靈云遠(yuǎn)場語音識別解決方案。
靈云遠(yuǎn)場語音識別解決方案全面整合了最新靈云遠(yuǎn)場語音識別、語音喚醒、聲源定向、降噪、回聲消除、端點檢測等實用化語音、信號處理技術(shù),是迄今為止國內(nèi)市場上推出的最完整、實用化程度最高的遠(yuǎn)場智能語音交互解決方案。靈云遠(yuǎn)場語音識別解決方案的推出,徹底打破了車載、家居、家電等各種設(shè)備應(yīng)用自然語音交互技術(shù)的產(chǎn)業(yè)瓶頸,讓每個人都能實現(xiàn)通過話語輕松操作各種設(shè)備的科幻夢想,全力推動智能語音交互在車載、家居、機器人等領(lǐng)域進(jìn)入實用化階段,這也標(biāo)志著智能化生活從此距離中國億萬家庭不再遙遠(yuǎn)!
靈云遠(yuǎn)場語音識別 開啟智能生活新時代
很長一段時間以來,國內(nèi)外語音技術(shù)公司都在努力開拓智能終端設(shè)備市場,但智能終端設(shè)備在很多場景下因語音交互體驗不如人意而難以滿足市場的需求,今年春節(jié)期間風(fēng)靡媒體的山東大哥開車應(yīng)用語音打電話的視頻,就是一個語音識別在車載噪音情況下無法實現(xiàn)準(zhǔn)確語音識別的典型案例。車載、家居等環(huán)境下語音識別準(zhǔn)確率低,主要原因還是因為語音識別受限于不同場景中的背景噪音、回聲、混響等多重復(fù)雜因素,進(jìn)而造成必須要近距離對講而且識別率低的明顯痛點,遠(yuǎn)場語音識別效果也因此成為制約語音識別技術(shù)在各種終端設(shè)備中應(yīng)用的瓶頸。
捷通華聲順應(yīng)產(chǎn)業(yè)的強烈需求,在清華大學(xué)的鼎力支持下,憑借多年潛心研究與市場積累,通過與華為、小米、樂視、海爾、長安、吉利、比亞迪、眾鴻、航盛、日產(chǎn)、現(xiàn)代、新松、科沃斯等眾多智能家居、家電、車載、機器人廠商的設(shè)備與技術(shù)的磨合,終于推出了全面整合語音識別、語音喚醒、聲源定向、降噪、回聲消除、端點檢測等技術(shù)的靈云遠(yuǎn)場語音交互解決方案,并在實際應(yīng)用中取得了非常好的效果。
在電視等家電設(shè)備的實際應(yīng)用中,首先通過遙控器或者電視機中麥克風(fēng),由靈云語音喚醒“叫醒”電視機,當(dāng)電視機被叫醒,靈云聲源定向技術(shù)將指令麥克風(fēng)始終指向說話人,減少外界噪音的錄入,并對獲取到的聲音進(jìn)行降噪及回聲消除的處理,使獲取到的聲音清晰純凈;當(dāng)說話人停止說話時,靈云端點檢測技術(shù)將自動停止語音收集,所獲取的清晰語音通過靈云語音識別轉(zhuǎn)換成準(zhǔn)確指令,實現(xiàn)語音操作。例如,當(dāng)電視機處于待機狀態(tài)時,對著遙控器或者電視機講一聲“小靈,打開電視”,電視機就會立即啟動并開始播放節(jié)目,此時,電視所播放的節(jié)目聲音會與語音操控指令發(fā)生沖突,而有了靈云回聲消除技術(shù),電視節(jié)目聲音將自動被“屏蔽”,麥克風(fēng)只接收說話人的語音命令,因此如果想換頻道,只要再講一聲“我想看某某臺”,電視就會自動切換到所要看的頻道。
可以想象,基于靈云遠(yuǎn)場語音識別技術(shù)解決方案,用戶在以家庭為單位的活動范圍內(nèi),幾乎可以通過語音輕松操控家里的電視、空調(diào)、冰箱等所有設(shè)備,讓電影中的語音智能化生活變成現(xiàn)實。
在智能車載領(lǐng)域,靈云遠(yuǎn)場語音識別技術(shù)解決方案一樣可以大顯身手。當(dāng)汽車在路上行駛,司機想通過語音控制打電話、聽音樂時,無論是汽車行駛過程中產(chǎn)生的胎噪,還是車外噪音都會嚴(yán)重影響語音識別準(zhǔn)確率,而靈云降噪技術(shù)通過對汽車內(nèi)外環(huán)境噪音進(jìn)行處理,能夠準(zhǔn)確識別司機的語音命令,從而幫助司機實現(xiàn)對車載智能終端的語音控制,可以輕松通過語音命令打電話、發(fā)信息,也可以自動接聽電話、通過語音播報收聽手機短信;如果想緩解一下駕駛疲勞,只要隨口說出想聽的音樂、歌曲,電臺頻道就可以完成操作,而不需要一手把握方向盤,一手高舉手機,或者“手忙腳亂”的一手把握方向盤,一手操作選臺按鈕“找啊找”。據(jù)交通事故分析統(tǒng)計,相當(dāng)多的交通事故原因都是由于司機開車過程中接聽電話、或因操作車內(nèi)各種設(shè)備分散注意力所造成的,靈云遠(yuǎn)場語音交互技術(shù)解決方案能夠幫助司機專心駕駛,保證行車安全。
伴隨近一兩年機器人產(chǎn)業(yè)的高速成長,大眾對機器人走進(jìn)日常生活充滿幻想與期待,雖然機器人制造水平相比過去有非常大的進(jìn)步,機器人生產(chǎn)成本的降低也能夠讓更多機器人走進(jìn)大眾工作、生活場景,但實際上與家電、車載設(shè)備語音控制不同,機器人將面對更加復(fù)雜多樣的聲音環(huán)境,因此,機器人能否與人輕松、準(zhǔn)確進(jìn)行語音交流將決定機器人的實用化程度。靈云遠(yuǎn)場語音識別解決方案通過與國內(nèi)機器人廠商的合作,語音交流效果已得到了很好的驗證,國內(nèi)有一家已經(jīng)引進(jìn)機器人并安排在營業(yè)大廳的金融客戶,一直為語音識別效果不佳而感到“痛苦”,在體驗到靈云遠(yuǎn)場語音識別技術(shù)之后,決定采用靈云遠(yuǎn)場識別技術(shù)解決方案對引進(jìn)機器人進(jìn)行重新設(shè)計。
捷通華聲在此次推出靈云遠(yuǎn)場語音識別解決方案的同時,向產(chǎn)業(yè)界開放了靈云內(nèi)容平臺(hcicloud.com),人們可以通過與各種設(shè)備的語音交互,輕松并免費獲取靈云內(nèi)容平臺所提供的天氣、交通、列車、航班、音樂、視頻、餐飲等日常生活常用的30多種信息與內(nèi)容服務(wù),使應(yīng)用效果與體驗更加豐富多彩。
相信隨著車載、家電、家居、機器人等智能終端設(shè)備的普及,靈云遠(yuǎn)場語音交互解決方案將會得到更廣泛的應(yīng)用,一個曾經(jīng)充滿神奇與幻想的智能生活時代,從此距離我們將不再遙遠(yuǎn)!
靈云平臺堅持合作共贏 與產(chǎn)業(yè)界攜手共創(chuàng)未來
靈云平臺(hcicloud.com)是捷通華聲于2011年推出的首個全方位人工智能開放平臺。歷經(jīng)四年發(fā)展,已成為國內(nèi)提供人工智能能力最多、服務(wù)用戶最廣的人工智能開放平臺。靈云平臺自推出以來面向產(chǎn)業(yè)全面開放,包括個人開發(fā)者在內(nèi)的所有合作伙伴,都可以通過靈云平臺獲取智能語音、智能圖像、智能語義、生物特征等技術(shù)能力。
2014年,為讓國內(nèi)車載、家居、家電、機器人等智能終端設(shè)備廠商、集成商、開發(fā)商更方便地使用靈云平臺(hcicloud.com)全方位人工智能能力,捷通華聲推出了企業(yè)級開發(fā)商專用的靈云智能終端交互方案:靈云種子。靈云種子全面整合了靈云平臺多項人工智能技術(shù)能力,包括靈云語音識別、語音合成、語義理解、聲紋識別、人臉識別、指紋識別、光學(xué)字符識別等能力,并為開發(fā)商提供簡單易用的開發(fā)接口。開發(fā)商通過應(yīng)用靈云種子,可以輕松實現(xiàn)智能語音交互、語音喚醒、語音導(dǎo)航、文字與證照圖像識別、聲紋解鎖、人臉識別等多種人機交互功能,全方位、多角度滿足家居、車載、家電、機器人對人工智能技術(shù)能力多樣化的市場需求。
一花開放不是春,捷通華聲將堅持 “合作共贏”的發(fā)展理念,與廣大合作伙伴共同分享人工智能產(chǎn)業(yè)機遇,共同創(chuàng)建良好的人工智能產(chǎn)業(yè)生態(tài)。為更好服務(wù)全國智能終端設(shè)備合作伙伴,捷通華聲將進(jìn)一步加快在全國各地建立分公司與辦事處的進(jìn)程,比如在中國華南地區(qū),智能車載、智能家居、機器人開發(fā)與生產(chǎn)廠商云集,并擁有創(chuàng)新力強、科技水平高等獨特優(yōu)勢。為做好合作伙伴的技術(shù)支持,2015年捷通華聲相繼在深圳、廈門等地成立了分公司,為合作伙伴提供更及時、更完善的技術(shù)支持。
未來發(fā)展,捷通華聲將繼續(xù)以清華大學(xué)人工智能研究力量為依托,更加專注智能語音等人工智能技術(shù)研究與產(chǎn)業(yè)化的推廣與應(yīng)用,通過與產(chǎn)業(yè)內(nèi)合作伙伴的精誠合作,共同推動中國智能終端設(shè)備全面服務(wù)社會大眾,共同加快智能化生活時代到來的步伐!
靈云平臺更多信息請訪問:www.hcicloud.com
靈云智能辦公平臺更多信息請訪問:aioffice.hcicloud.com
了解靈云產(chǎn)品與捷通華聲,請致電問詢靈云客服機器人:010-82826886-8898