此外,靈云語音識(shí)別(ASR)平臺(tái)級(jí)產(chǎn)品具有功能強(qiáng)大、識(shí)別率高、識(shí)別速度快、SDK開發(fā)簡單、開發(fā)包資源小等優(yōu)勢,能夠?qū)崟r(shí)、準(zhǔn)確地對(duì)輸入的語音進(jìn)行識(shí)別。捷通華聲根據(jù)不同的用戶需求又將靈云語音識(shí)別系列引擎iSpeak劃分為三種:
1.iSpeak Freetalk(自由說引擎):自由說引擎又稱“聽寫機(jī)”或“語音轉(zhuǎn)寫”,基本上不限定用戶說話的范圍、方式和內(nèi)容。自由說引擎可以對(duì)整段或者是分段傳入的音頻進(jìn)行識(shí)別,返回識(shí)別后的文本。
2.iSpeak KeywordSpot(關(guān)鍵詞檢出引擎):關(guān)鍵詞檢出引擎可以在連續(xù)語音流中檢測出是否存在某些感興趣的關(guān)鍵詞。在使用時(shí),需要事先給定一個(gè)關(guān)鍵詞列表,系統(tǒng)則給出識(shí)別出的關(guān)鍵詞在語音流中出現(xiàn)的位置。
3.iSpeak SpeechAnalysis(語音質(zhì)檢分析引擎):質(zhì)檢分析引擎在自由說引擎的基礎(chǔ)上,加入了針對(duì)語音質(zhì)檢分析的一些額外的分析處理能力,包括話者分離、情緒檢測、靜音檢測和語速檢測等等。
靈云語音識(shí)別上述三種引擎可以滿足IVR導(dǎo)航系統(tǒng)應(yīng)用的雙向需求:汽車智能體系既可以通過自助化語音服務(wù)進(jìn)行有效的分流、緩解駕駛?cè)藛T壓力,也可以通過識(shí)別結(jié)果挖掘用戶需求、完善地理導(dǎo)航精準(zhǔn)性和智能性,從而使汽車駕駛實(shí)現(xiàn)“人車合一”的高層境界享受。
靈云智能語音:源自清華 服務(wù)全球
捷通華聲作為國內(nèi)最早提供智能語音技術(shù)服務(wù)的專業(yè)化廠商,捷通華聲的靈云多語種語音合成(TTS)技術(shù)早已在金融、電信、交通、能源及CTI等領(lǐng)域大規(guī)模應(yīng)用,在高鐵、民航、醫(yī)院等眾多領(lǐng)域……捷通華聲的靈云語音合成技術(shù)幾乎無處不在,市場占有率超過50%,服務(wù)十三億大眾大十五年之久。有了靈云語音合成技術(shù)的雄厚市場基礎(chǔ),靈云語音識(shí)別在國內(nèi)語音市場異軍突起,“能說會(huì)聽”語音交互技術(shù)雙劍合璧,為車載導(dǎo)航、智能電視、穿戴式設(shè)備等廠商提供了最完整的智能語音解決方案。
十幾年來,捷通華聲始終堅(jiān)持自主研究語音合成、語音識(shí)別等智能人機(jī)交互(HCI)技術(shù),并始終在國內(nèi)智能語音技術(shù)領(lǐng)域保持領(lǐng)先者地位,在為智能駕駛、智慧城市等諸多領(lǐng)域提供多方面的智能技術(shù)服務(wù)支持的同時(shí),也為保證我國智能語音交互技術(shù)始終與世界發(fā)展同步做出了重要貢獻(xiàn)。2011年,捷通華聲開創(chuàng)性的推出了全球第一個(gè)最大、最全的智能人機(jī)交互技術(shù)開放平臺(tái) - 靈云,提供語音合成(TTS)、語音識(shí)別(ASR)、光學(xué)字符識(shí)別(OCR)、手寫識(shí)別(HWR)、語義理解、機(jī)器翻譯等智能人機(jī)交互(HCI)技術(shù)能力服務(wù),并以“云 + 端”的方式向開發(fā)者全面開放。
捷通華聲在發(fā)展智能語音與靈云平臺(tái)的過程中,得到了清華大學(xué)的鼎力支持。2013年,清華大學(xué)產(chǎn)業(yè)基金入資捷通華聲,也因此確立了捷通華聲與清華大學(xué)的戰(zhàn)略合作關(guān)系。在清華大學(xué)的支持下,捷通華聲開始全面實(shí)施“靈云科技 源自清華 服務(wù)全球“的戰(zhàn)略規(guī)劃,靈云智能語音識(shí)別與靈云語音合成技術(shù)產(chǎn)品相輔相成,不僅為智能導(dǎo)航、智能駕駛、信息安全等領(lǐng)域系統(tǒng)應(yīng)用提供更具中國漢語言特色的智能語音交互全面解決方案,也代表智能語音機(jī)交互技術(shù)在我國智能駕駛領(lǐng)域應(yīng)用進(jìn)入全面普及的階段。