不久,搜狗在其第三季度財報中,表示語音識別準確率已經(jīng)超過97%,頗有挑戰(zhàn)科大訊飛的架勢。為此眾多媒體紛紛對比測試,發(fā)現(xiàn)搜狗語音識別的確不遜色于科大訊飛。
近日,微軟的語音識別也有新突破。微軟科學(xué)家僅用一個月,就將英語的語音識別錯詞率從6.3%降到了5.9%,超越了人類所能達到的水平。
語音識別的技術(shù)突破對于用戶是福音,但對于行業(yè)從業(yè)者來說,有人歡喜有人愁。
數(shù)據(jù)流量入口爭奪戰(zhàn)
國內(nèi)做語音識別的企業(yè)并不少,但是良莠不齊,本文盤點了22家在國內(nèi)語音識別領(lǐng)域有代表性的企業(yè),從中探尋整個行業(yè)的發(fā)展現(xiàn)狀。
在眾多商業(yè)化應(yīng)用中,輸入法、車載語音、智能家居、教育測評是語音識別最為普遍的應(yīng)用模式。
其中,輸入法是最為優(yōu)質(zhì)的數(shù)據(jù)入口,由訊飛、百度、搜狗三家獨占;教育測評也是發(fā)展較成熟的一類,目前市場上各類外語教學(xué)、測評軟件,都有不錯的數(shù)據(jù)流量;而社交軟件的流量則被騰訊搶占了,在這種情況下,新興的語音識別公司不得不另辟蹊徑。
對于新崛起的科技公司,硬件搭配語音識別是一個很普遍的應(yīng)用模式,例如云知聲做智能家居,思必馳做智能車載語音系統(tǒng),出門問問推出智能手表。由于智能家居、車載語音、手表本身的場景要求,其需要處理的語音復(fù)雜度較低,對于數(shù)據(jù)流量的要求也沒那么苛刻。
至此,數(shù)據(jù)流量幾乎被全部搶占,后來者能參與的只是商業(yè)模式的復(fù)制和差異化。
超半數(shù)語音識別企業(yè)落戶北京
在區(qū)域分布上,國內(nèi)語音識別的公司大都集中在北京,22家中有12家總部位于北京,占比54.5%。如此高的集中度,跟北京濃厚的科研氛圍分不開。其中,中科院對于國內(nèi)語音識別技術(shù)的影響最為深遠,作為國內(nèi)語音識別行業(yè)領(lǐng)頭羊的科大訊飛,雖然總部在合肥,但也是與中科院聲學(xué)所、中國科大共同創(chuàng)立的一家企業(yè)。
在幾個影響力較大的語音識別企業(yè)中,跟中科院有合作,或有中科院背景的公司就有科大訊飛、百度、捷通華聲、中科信利、云知聲5家,可見語音識別行業(yè)對尖端技術(shù)的依賴。
小公司的生存狀況堪憂
雖然語音識別技術(shù)的突破是廣大用戶的福音,但是對于行業(yè)內(nèi)的小公司來說,并不是好消息。因為語音識別屬于技術(shù)密集型產(chǎn)業(yè),行業(yè)格局已基本穩(wěn)定,所以像搜狗、訊飛一類大公司的技術(shù)突破對小公司核心競爭力的沖擊就更加強烈。而且在資本寒冬的環(huán)境下,行業(yè)里的“馬太效應(yīng)”更加明顯。
在近兩年時間里,以上22家企業(yè)中能拿到融資的創(chuàng)業(yè)公司并不多,僅有5家。明顯能看到,資金在朝著規(guī)模更大、技術(shù)更強的企業(yè)流動,行業(yè)內(nèi)的寡頭開始形成。筆者在搜集企業(yè)的過程中,發(fā)現(xiàn)更多小規(guī)模的語音識別公司沒有拿到融資,或融資未披露。
不同于制造業(yè)企業(yè),互聯(lián)網(wǎng)企業(yè)往往愿意披露自身融資信息,這對品牌也是一種公關(guān)。所以說,融資未披露的原因很可能是得不到資本的認可,小公司的生存狀況堪憂。
由此可推測,語音識別行業(yè)高速增長的紅利期已經(jīng)過去,格局基本形成,規(guī)模小的團隊在技術(shù)上難有創(chuàng)新和突破。在商業(yè)模式上,成熟的模式也已經(jīng)出現(xiàn),例如教育測評、車載語音。過于新奇或者過早出現(xiàn)的商業(yè)模式也得不到資本的認可,例如智能語音炒鍋和語音支付。