標貝科技是36氪持續(xù)關(guān)注的一家AI公司,成立于2016年2月,最早做數(shù)據(jù)服務(wù),現(xiàn)已升級,主要做語音合成(TTS)整體解決方案及相關(guān)數(shù)據(jù)服務(wù):所推出的名為“聲音超市”的產(chǎn)品,可提供多音色的語音合成服務(wù);數(shù)據(jù)服務(wù)主要包括音庫制作、文本標注、評測系統(tǒng)、語音轉(zhuǎn)寫、聲音采集標注等。
作為人機交互的重要領(lǐng)域,語音合成技術(shù)近兩年發(fā)展迅速。端對端合成技術(shù),以及神經(jīng)網(wǎng)絡(luò)聲碼器技術(shù)的研究成果,使得語音合成的效果大幅提升。語音合成技術(shù)的應(yīng)用也成為這兩年智能語音交互領(lǐng)域的一個熱點。國外,去年,Google系的Lyerbird推出了一套“只需一分鐘的聲音樣本就能模仿任何人說話”的系統(tǒng);今年,微軟在其公有云平臺上推出了語音合成定制服務(wù)產(chǎn)品Custom Voice。國內(nèi),訊飛推出了“訊飛留聲”,只需要10段的聲音采集即可完成個人聲音的復(fù)刻。
標貝科技是國內(nèi)語音合成領(lǐng)域以技術(shù)見長的創(chuàng)業(yè)公司。當下其優(yōu)勢體現(xiàn)在語音合成效果更好,“個性化聲音”定制實現(xiàn)周期更短。這與團隊技術(shù)背景及數(shù)據(jù)積累有關(guān)。數(shù)據(jù)上,團隊此前做語音數(shù)據(jù)服務(wù),積累了大量的語料數(shù)據(jù)。同時,研發(fā)了高效的數(shù)據(jù)標注工具,提高了數(shù)據(jù)標注的效率。技術(shù)上,CTO李秀林從事語音行業(yè)十余年,曾就職于百度,并帶領(lǐng)團隊獲得百萬美元大獎。
產(chǎn)品方面,今年5月,標貝科技打造了“聲音超市”,為客戶提供一個可供選擇的、所聽即所得的聲音平臺。主要按照API調(diào)用、SDK進行收費。目前已為360、網(wǎng)易等提供數(shù)據(jù)及語音合成技術(shù)服務(wù)。
與語音識別、語義理解等智能語音交互的技術(shù)相比,語音合成技術(shù)被認為是有機會單獨存在而無需做全棧的一個方向。且隨著技術(shù)的成熟,開始在諸如語音交互、有聲讀物、新媒體、智能客服、泛娛樂領(lǐng)域開始被應(yīng)用。這也是當前標貝主要商業(yè)落地的領(lǐng)域。
CEO劉博介紹,目前在智能客服領(lǐng)域,標貝已與智齒等建立合作,進入銀行和金融機構(gòu);在有聲讀物、新媒體等領(lǐng)域,標貝已與央視、出版社等達成合作;在語音交互領(lǐng)域,標貝的主要客戶為智能音箱客戶;在泛娛樂領(lǐng)域,也與幾個明星工作室達成了合作;整體來看,目前智能客服領(lǐng)域的付費能力更好,預(yù)計明年新媒體、有聲讀物領(lǐng)域的付費能力會有所提升。
現(xiàn)階段,標貝科技的主要營收還是來自于數(shù)據(jù)業(yè)務(wù),主要客戶包括了阿里、百度、騰訊、搜狗等。根據(jù)獵云網(wǎng)的數(shù)據(jù),標貝科技已成功為客戶提供了總規(guī)模約1500小時的IP語音庫數(shù)據(jù)。
劉博認為,對標貝來說,當下技術(shù)與數(shù)據(jù)兩項業(yè)務(wù)都會是公司重點。數(shù)據(jù)方面,公司去年開始已將部分資金投入到特色IP聲音數(shù)據(jù)的儲備;技術(shù)方面,公司目前的時間窗口還有半年左右,明年新的技術(shù)會突破。
當BAT等大廠開始關(guān)注到語音合成技術(shù),語音合成的賽道未來競爭也很可能更為激烈。劉博認為,一方面,大公司往往需要做全棧技術(shù),技術(shù)上未必有創(chuàng)業(yè)公司專注,另一方面,標貝科技目前會從三方面提升競爭力,包括提升數(shù)據(jù)壁壘、廣泛布局聲音類型IP、技術(shù)上尋求新突破。