發(fā)表評論分享按鈕

語義識別難住中國Siri 商用前景仍不明朗

2012/04/06

  4月5日消息,“Siri是催化劑,但是能否修成正果尚需時日! 小i機(jī)器人董事長袁斌對TechWeb表示。

  自從去年10月,借助發(fā)布iPhone 4S之勢推出Siri語音問答系統(tǒng)以來,全世界都掀起了一場語音技術(shù)熱潮,這些長期被邊緣化的公司瞬間成為了市場關(guān)注的焦點。前有Ciriis和Airi,后有科大訊飛的“語點”。


圖:Siri最難的技術(shù)不是語音,而是語義識別

  被資本市場高度熱捧的是市場是機(jī)會還是陷阱?目前下定論顯然有點早。

  過去的一個月,TechWeb走訪了國內(nèi)眾多從事語音技術(shù)的公司,發(fā)現(xiàn)這些Siri的跟隨者們都面臨的共同問題是,聽得懂你在說什么,卻不理解你在說什么。至少目前來看,語音市場距離大規(guī)模商用依然有不小的距離。

  這個問題的出現(xiàn)并不意外,因為即便是蘋果的Siri同樣困擾于此。近日,Siri在國外遭到了多起訴訟,原因是Siri無法準(zhǔn)確理解用戶的問題,蘋果涉嫌夸大宣傳。由此可見,如果Siri尚且不夠完美,那么中國的Siri必定還有更多的路要走。

  “最后的禮物”不完美

  2011年10月,蘋果iPhone 4S發(fā)布,雖然iPhone 4S無甚亮點,但其配備的語音控制助手Siri一經(jīng)發(fā)布便艷驚全球。被稱為喬布斯送給這個世界“最后的禮物”。

  這是蘋果唯一一款打上Beta標(biāo)簽的產(chǎn)品,但卻承載了巨大的期望。蘋果可以借此機(jī)會創(chuàng)建一個人工智能程序的生態(tài)系統(tǒng),將Siri做成平臺,讓Siri與其他程序結(jié)合,Siri本身將成為入口。其結(jié)果是谷歌的搜索形式將被顛覆,用戶可以通過更自然的交互方式直接獲得答案!都~約時報》撰文稱:Siri代表著蘋果的商業(yè)未來,也預(yù)示著未來“搜索”的形態(tài)。

  雖然蘋果有長遠(yuǎn)的規(guī)劃,但Siri的發(fā)布還是略顯倉促,實現(xiàn)這些美好愿景尚需時日。Siri所具有的發(fā)電子郵件、播放音樂、安排會議等諸多功能用戶使用頻率并不高。最新的一項調(diào)查顯示,30%的用戶從未使用Siri來發(fā)送電子郵件,32%的用戶分別表示自己從未使用Siri播放音樂。對Siri表示非常滿意的用戶只有55%。

  本月早些時候,紐約iPhone 4S用戶弗蘭克·法齊奧(Frank M. Fazio)在加州聯(lián)邦法院提起訴訟,指控蘋果發(fā)布的廣告中對Siri功能的描述存在“誤導(dǎo)性和欺騙性信息”。另一位iPhone 4S用戶大衛(wèi)·瓊斯(David Jones)在美國加州庫珀蒂諾對蘋果提起訴訟,指控蘋果錯誤地描述了Siri功能!癝iri要么無法理解原告所提出的問題,要么在經(jīng)過長時間等待后提供了錯誤的答案!

  語義識別之難

  為什么Siri會有這些不完美?國內(nèi)從事了十年智能網(wǎng)絡(luò)機(jī)器人研究的小i機(jī)器人董事長袁斌解釋稱,Siri最難的技術(shù)不是語音,而是語義識別。

  我們現(xiàn)在看到的Siri實際上由兩部分組成,一部分是語音識別,一部分是語義識別。當(dāng)用戶對Siri講一句話時,語音識別分析出這句話說的是什么,語義識別分析出這句話是什么意思。語音和語義兩部分技術(shù)在Siri中所占的比例分別是20%和80%。也就是說,要正確理解用戶的意思并作出反應(yīng),語義識別實際上更為關(guān)鍵。

  脫胎于美國國防部技術(shù)的Siri真正擅長的是語義識別。語音識別部分,Siri選擇跟語音識別引擎Nuance合作。Siri現(xiàn)在的任務(wù)是不斷加強其語義識別能力,建立更加龐大的數(shù)據(jù)庫。據(jù)說蘋果已經(jīng)在印度招大量工程師進(jìn)行數(shù)據(jù)庫的梳理。

  語義識別的另外一個挑戰(zhàn)是,內(nèi)容越多,對智能識別的挑戰(zhàn)越大,需要的算法更強。

  從事了多年語音技術(shù)研究的李開復(fù)也表達(dá)過類似的觀點,他說:“人們一旦開使用語音跟你交流了,就會把你當(dāng)做一個人,這個帶來的超級高的期望值會給語音帶來很大的挑戰(zhàn)!

  Siri不適合創(chuàng)業(yè)公司

  Siri的火爆讓不少國內(nèi)的創(chuàng)業(yè)者非常興奮,因為它代表著一個可以探索的新方向。但是不少業(yè)內(nèi)人士對此表示懷疑態(tài)度。

  李開復(fù)曾在微博中稱:“‘中國Siri’創(chuàng)業(yè)計劃不太適合中國創(chuàng)業(yè)公司,需要解決的問題很多也很棘手,主要是新的智能語音控制技術(shù)如何引導(dǎo)用戶行為,再是克服海量數(shù)據(jù)學(xué)習(xí)門檻和應(yīng)用整合困難等!

  國內(nèi)現(xiàn)在已有的類Siri應(yīng)用,Ciriis和Airi,尚且都停留在娛樂層面。而前段時間科大訊飛高調(diào)發(fā)布的“訊飛語點”也并未有實質(zhì)性突破,如果一句話中間增加停頓,它便無法正確理解。

  袁斌認(rèn)為,要做中國的Siri,第一需要語料庫,第二需要人工智能的算法。訊飛擁有前者的優(yōu)勢,但后者仍需積累摸索。“需要長期的、系統(tǒng)的平臺去處理每天進(jìn)來的海量的知識,經(jīng)過長期的集聚,形成工程化的產(chǎn)品,最后才能對每天進(jìn)來的知識進(jìn)行去重、篩選,同時能夠?qū)W習(xí)新的知識點!

  在這一點上,袁斌的小i機(jī)器人有值得借鑒的經(jīng)驗。

  小i機(jī)器人是一款網(wǎng)絡(luò)機(jī)器人,主要應(yīng)用于運營商、銀行等的網(wǎng)絡(luò)客服系統(tǒng)。小i機(jī)器人從2001年開始開發(fā),最終以IM聊天機(jī)器人的形式推出,經(jīng)歷了個人用戶激增、產(chǎn)品線眾多、用戶滿意度下降、公司負(fù)擔(dān)過重等一系列問題,最終艱難轉(zhuǎn)型。而這些問題與今天的Siri以及類Siri應(yīng)用面臨的問題非常相似。

  袁斌認(rèn)為,無論誰做語音控制技術(shù)或者智能識別技術(shù),這些問題都無法繞開。解決了,則柳暗花明,解決不了,只有死路一條。

TechWeb



相關(guān)閱讀:
紐約時報:iPhone催生“愚蠢游戲”興起 2012-04-06
Siri打電話與發(fā)短信功能流行 其它功能遭冷遇 2012-03-27
Siri發(fā)展趨勢預(yù)測:主動發(fā)現(xiàn)用戶感興趣內(nèi)容 2012-03-26
蘋果招募電話軟件工程師疑推自有移動語音服務(wù) 2012-03-26
Siri登陸日本 用戶評價不佳 2012-03-14

熱點專題:  語音合成TTS 語音識別ASR    移動互聯(lián)網(wǎng)
分類信息:  移動互聯(lián)網(wǎng)_與_語音應(yīng)用  移動互聯(lián)網(wǎng)_與_移動  移動互聯(lián)網(wǎng)_與_移動