首頁>>廠商>>語音識別與合成>>Nuance

發(fā)表評論分享按鈕

讓你的設(shè)備更加智能,語音技術(shù)如何提升用戶體驗(yàn)?

2012/05/25

  你可能不知道Nuance是做什么的,但你一定知道iPhone 4S帶來的一項(xiàng)革 命性的人機(jī)交互產(chǎn)品——“Siri”。事實(shí)上,為“Siri”提供語音數(shù)據(jù)庫支持的正是Nuance,此前曾用過一段時間Vlingo的平臺。

  作為全球領(lǐng)先的語音和語言解決方案提供商,Nuance因?yàn)槭荰9輸入法的擁有者被業(yè)界所熟知,目前全球90%以上的手機(jī)都采用T9輸入法,這個輸入法原本是一家名為“Tegic Communications”所開發(fā),后來被Nuance買了下來。Nuance同時也在近期收購了滑動輸入法的公司Swype。

  關(guān)鍵的數(shù)據(jù)收集

  近日Nuance在深圳舉行了“2012年Nuance移動論壇”,這家以往“隱身”于各大國際公司背后的企業(yè)出現(xiàn)在了國內(nèi),吸引了深圳諸多廠商的興趣。Nuance在會上展示了三段不同的Video,這三段Video其中就有大家所熟知的Siri的廣告片,另外一段則是Nuance自己的“聲龍”系列產(chǎn)品,最后一段則是將語音技術(shù)結(jié)合手勢控制應(yīng)用到智能電視的場景。通過短片,Nuance不但展示了目前語音技術(shù)發(fā)展的最新動態(tài)和趨勢,同時也展示了諸多國際企業(yè)所重視的關(guān)鍵點(diǎn)——用戶體驗(yàn),這將是在未來企業(yè)競爭中取勝的殺手锏。而Nuance的目標(biāo),也就是幫助這些企業(yè)提高用戶體驗(yàn)。

Nuance大中華區(qū)總經(jīng)理 鄭裕慶
 
圖:Nuance大中華區(qū)總經(jīng)理 鄭裕慶

  語音技術(shù)的出現(xiàn)顯著改變了人機(jī)互動的方式,但如果你對Siri有一定的研究,你會發(fā)現(xiàn)其實(shí)語音識別技術(shù)(ASR)只占到其中的20%,真正重要的則是語義識別技術(shù)。語義識別能幫助用戶更準(zhǔn)確地能否搜索出想要的結(jié)果。這種技術(shù)基于Statistic Language model(語言模型統(tǒng)計(jì)),需要大量的數(shù)據(jù)來完善搜索的結(jié)果。同時對于自然語言的理解(NLU技術(shù)),也需要數(shù)據(jù)庫的數(shù)據(jù),來進(jìn)行語法的收集!霸蕉嗟臄(shù)據(jù),越容易幫助我們配對用戶所需要的內(nèi)容,了解用戶的意圖,將意圖翻譯成行動,效果最終也是取決于本身數(shù)據(jù)的質(zhì)量!盢uance大中華區(qū)總經(jīng)理鄭裕慶表示。

  Nuance的Dragon Go憑借在美國的Apple App Store和Android Market兩大移動應(yīng)用平臺巨大的下載量而被用戶熟知。Dragon Go將Nuance的聲龍語音識別和自然語言理解技術(shù)與人工智能技術(shù)相結(jié)合,從而顯著簡化了搜索移動內(nèi)容的體驗(yàn)。因此,用戶僅憑借語音便能得到他們想要的內(nèi)容,并能將更多的時間用于瀏覽而非查找在線內(nèi)容。也就是說,Dragon Go能聽懂用戶說的話并能理解用戶意圖。用戶僅需說出一個簡單的短語,他們所喜愛和最相關(guān)的內(nèi)容提供商便會顯示在眼前,用戶能輕松地獲取餐廳評述、購買電影票、觀看流媒體電影和電視節(jié)目、在線購物、查找方向、聽喜愛的音樂、還可以通過Expedia預(yù)定酒店。

  如何提供更好的用戶體驗(yàn)?

  據(jù)了解,目前Nuance主要采用兩種商業(yè)模式。一種是直接向OEM廠商和制造廠商提供語音技術(shù)和解決方案,同時收取授權(quán)費(fèi)用。這里不僅包括了手機(jī)、TV、PC等消費(fèi)電子產(chǎn)品,還包括大量的企業(yè)級行業(yè)應(yīng)用。另一方面,Nuance提供了自主研發(fā)的產(chǎn)品“如Dragon go”,供智能手機(jī)用戶方便的在AppStore以及Android Market免費(fèi)下載。通過向消費(fèi)者提供免費(fèi)下載使用,Nuance得以收集龐大的語音數(shù)據(jù),從而對語音引擎進(jìn)行訓(xùn)練,從而提高引擎的準(zhǔn)確度。

  “我們的DragonDictation(聲龍聽寫)和DragonSearch(聲龍搜索)這兩個應(yīng)用,是比蘋果的Siri出來還要早,就是因?yàn)槲覀円茸銮捌谕度,只有收集了這個數(shù)據(jù)庫,才能提高產(chǎn)品體驗(yàn)。”鄭裕慶表示,數(shù)據(jù)庫的豐富程度會直接影響到語音和語義的辨識度。所以Nuance早在1999年就已經(jīng)開始在PC上應(yīng)用語音引擎,到目前為止已經(jīng)更新了11個版本,可以說是一個非常成熟的引擎。

  “除了成熟的引擎,我們最大的優(yōu)勢,其實(shí)是如何能把用戶體驗(yàn)做得更好的經(jīng)驗(yàn)。事實(shí)上語音識別率已經(jīng)不是目前最重要的因素了,因?yàn)榇蠹铱赡懿罹喽疾惶。但是用戶體驗(yàn)就不一樣了!编嵲c表示,包括如何解決噪音問題、如何優(yōu)化語音控制界面,這些提高用戶體驗(yàn)的東西,Nuance有著豐富的經(jīng)驗(yàn)以及完善的解決方案。

  據(jù)統(tǒng)計(jì),2011年通過云端訪問Nuance的語音數(shù)據(jù)庫便有20億的訪問量。而據(jù)鄭裕慶介紹,Nuance目前已經(jīng)跟不少國際知名的品牌進(jìn)行了合作。其中就包括三星智能電視,以及BMW汽車。而在今天年年初,Nuance也發(fā)布了跟Intel的合作,未來Nuance將為Urtrabook提供語音服務(wù),包括開啟軟件、寫email、更新社群網(wǎng)站、控制音樂播放等操作都可通過語音完成。

    Dragon TV讓電視真正智能

  在論壇現(xiàn)場,鄭裕慶還特別強(qiáng)調(diào)了Nuance在數(shù)字客廳領(lǐng)域的創(chuàng)新。作為智能語音技術(shù)在數(shù)字客廳應(yīng)用的創(chuàng)新應(yīng)用方案,Dragon TV是一款專門針對電視原始設(shè)備制造商和運(yùn)營商開發(fā)的一種獨(dú)特的語音和自然語言平臺,它可以讓消費(fèi)者在數(shù)字起居室內(nèi)利用語音、自然語言理解和觸摸輸入等移動創(chuàng)新技術(shù),獲得無縫、直觀的互動體驗(yàn),使電視也成為與他們的手機(jī)、平板電腦、計(jì)算機(jī)和汽車一樣最常用的設(shè)備。消費(fèi)者不僅能使用自然語指令切換頻道、搜索在線內(nèi)容、訪問三星SmartHub,還可以通過Skype與朋友和家人交流。用戶僅需說一聲“HiTV(你好,電視),開機(jī)”,便能打開電視。

  借助該平臺,消費(fèi)者將不再受困于傳統(tǒng)電視遙控器繁瑣的操控方式,Dragon TV使電視從單純的接收設(shè)備變身為了一個互動系統(tǒng)。同時通過攝像頭鎖定技術(shù)以及手勢控制技術(shù),Dragon TV可以在一定范圍內(nèi)鎖定用戶,這樣在語音控制的過程中,不會出現(xiàn)噪音干擾的問題。

現(xiàn)場展示的采用Dragon TV的智能電視,可通過手勢進(jìn)行控制

  圖:現(xiàn)場展示的采用Dragon TV的智能電視,可通過手勢進(jìn)行控制

  Dragon TV還可以使數(shù)字家庭設(shè)備所集成的電子郵件、社交網(wǎng)絡(luò)和互動通信等應(yīng)用的操作變得更加直接簡單。憑借Nuance強(qiáng)大的語音和自然語言技術(shù),用戶獲取內(nèi)容時只需要說出頻道名稱、電視臺名稱、節(jié)目和電影的名稱等,便可完成直達(dá)目標(biāo),開始一場愉悅的互動視覺旅程。而隨著Dragon TV的發(fā)布,包括服務(wù)提供商、消費(fèi)電子廠商和通過互聯(lián)網(wǎng)傳輸(OTT)的內(nèi)容提供商等角色將共同構(gòu)成一個更具競爭力的互聯(lián)網(wǎng)電生態(tài)系統(tǒng),在為用戶提供更佳應(yīng)用體驗(yàn)的基礎(chǔ)上,贏得更廣闊的市場先機(jī)。
  
    語音技術(shù)的門檻

  盡管有消息稱,蘋果iOS下一個版本將會出現(xiàn)中文版本,但是在這個市場空白期,足以給“中國版siri”以成長空間。在中國,Nuance受到了類似于安徽科大訊飛這樣的專注中文語音識別的本土廠商的強(qiáng)烈挑戰(zhàn)。不過鄭裕慶認(rèn)為Nuance在中文領(lǐng)域并不存在劣勢,“我們現(xiàn)時支持普通話和廣東話。還有臺灣國語。對于中文最難解決的口音問題嗎,我們從1999年開始就在采集各種口音來訓(xùn)練我們的引擎,”

  作為全球最大的手機(jī)制造中心以及市場,對于中國的手機(jī)廠商來說,在從功能機(jī)轉(zhuǎn)型智能機(jī)的過程中,他們急切的希望能夠添加完善的語音解決方案,而不僅僅是簡單的下載一個“語音識別”輸入法或應(yīng)用這么簡單。

  對于Nuance來說,目前與本土中小客戶的合作還存在一些顧慮!耙?yàn)镹uance的技術(shù)團(tuán)隊(duì)人手有限,我們只可以跟比較大型的廠家里如Top10的廠家合作,我們其實(shí)在整個市場占有率已經(jīng)很大,如果手機(jī)廠家前八大的,差不多市場已經(jīng)一大塊已經(jīng)沒有了,就是被他們已經(jīng)拿走了。其他的我們看見的,因?yàn)槲覀円惨切┖献,但是合作下來,我們看見比較辛苦,為什么?可能這一天他在,明天就不在,好多就是這樣,突然冒起來,到一天又沒有了,就是變成花很多時間上去,但是不可以連續(xù)是這樣子。”鄭裕慶表示,其實(shí)語音解決方案對于技術(shù)和投入的要求還是很高的,需要投入大量的人力物力,一些小公司很難有這個決心去做!氨热缯Z音的話,就是你要知道怎么去設(shè)計(jì)這個語音界面,,需要有語音設(shè)計(jì)背景的專業(yè)人員。技術(shù)和硬件都有要求。硬件如耳麥等,要求用比較好的產(chǎn)品,但是會提高成本。出于技術(shù)成熟度來考慮,需要對產(chǎn)品有一定時間的磨合,比如Siri從蘋果收購到最終出產(chǎn)品就用了兩年,這些對于中小客戶來說都不太可能接受!

從左到右依次為:JasonStirling,Nuance亞太區(qū)高級副總裁、鄭裕慶,Nuance大中華區(qū)總經(jīng)理、StuartSharpe,Nuance亞太區(qū)銷售工程部高級總監(jiān)

  圖:從左到右依次為:Nuance亞太區(qū)高級副總裁 JasonStirling、
Nuance大中華區(qū)總經(jīng)理 鄭裕慶、Nuance亞太區(qū)銷售工程部高級總監(jiān) StuartSharpe
共 3 頁:1 2 3 

電子工程專輯



相關(guān)閱讀:
Nuance為三星Smart TV提供獨(dú)特的聲龍語音技術(shù) 2012-05-17
2012年Nuance移動論壇:語音技術(shù)帶來便捷的數(shù)字生活 2012-05-16
Spansion與Nuance加快嵌入式語音識別技術(shù)創(chuàng)新應(yīng)用 2012-04-12
Nuance Research:消費(fèi)者喜愛的移動應(yīng)用功能有哪些? 2012-03-22
Nuance收購醫(yī)學(xué)語音轉(zhuǎn)寫和編輯服務(wù)商Transcend 2012-03-09

熱點(diǎn)專題:  語音合成TTS 語音識別ASR    移動互聯(lián)網(wǎng)
分類信息:  移動互聯(lián)網(wǎng)_與_移動