11月28日,捷通華聲宣布靈云開放平臺推出多語種語音合成(簡稱TTS)技術,全面支持中文、英語、法語、俄語、西班牙語、阿拉伯語、德語、葡萄牙語、日語、韓語、泰語等11種語言,覆蓋全球90%以上的國家和地區(qū)。這也是捷通華聲推出覆蓋92種語言的手寫識別(HWR)技術之后的另一項重大突破。目前,靈云多語種TTS已經(jīng)在靈云開放平臺(www.hcicloud.com)全面開放使用。
語音合成即TTS(Text to Speech)技術,又稱文語轉換技術,能將任意文本信息實時轉化為標準流暢的語音朗讀,簡單講就是讓“機器開口講話”。通過TTS技術,計算機可以在任何時候將任意文本“輕松”轉換成具有高自然度的語音,從而真正實現(xiàn)讓機器“像人一樣開口說話”。
創(chuàng)建于2000年的北京捷通華聲語音技術有限公司,是國內(nèi)最早從事中文TTS研究與應用的企業(yè),捷通華聲中文語音合成(TTS)技術在國內(nèi)已處于絕對領先地位,市場占有率超過50%。十幾年來,捷通華聲始終堅持自主研究語音合成(TTS)、語音識別(ASR)等智能人機交互(HCI)技術,并不斷推出粵語、維吾爾語等方言與少數(shù)民族語音合成技術,為保證我國中文智能語音技術始終處于世界領先地位做出了主要貢獻。從2000年到今天的13年間,捷通華聲無時無刻、無處不在地為中國13億大眾提供最先進的智能語音服務。
2011年12月08日,捷通華聲創(chuàng)造性推出了全球第一個最大、最全的智能人機交互(HCI)技術開放平臺 — 靈云(www.hcicloud.com)。靈云是一種可以用語音、手寫、拍照、手勢,將來甚至可使用腦波識別等智能手段來操作、感知手機、計算機等數(shù)字設備的網(wǎng)絡云服務,發(fā)展目標是讓人機交互像人與人溝通一樣的簡單自然。靈云以“云 + 端”方式,為中國整個信息產(chǎn)業(yè)領域提供語音合成(TTS)、語音識別(ASR)、手寫識別(HWR)、光學字符識別(OCR)和自然語言理解(NLU)等多項核心技術能力。自靈云推出以來,靈云開放平臺與超過千家企業(yè)形成合作伙伴關系,為各行各業(yè)企業(yè)提供了全方位HCI技術支撐。兩年來,靈云智能語音等HCI技術助力并通過百度導航、導航犬、搜狗地圖、嘀嘀打車、漢字英雄、天行聽書、觸寶輸入法、百度PC輸入法、天行輸入法等家喻戶曉的移動應用服務大眾,為超過近3億社會大眾提供輕松、便捷的HCI技術服務。
伴隨著經(jīng)濟全球化的迅速發(fā)展,中國企業(yè)全面開始走向世界,捷通華聲為順應中國企業(yè)國際化潮流,適時在靈云平臺推出多語種TTS能力,成功將世界主流語種納入其中,為需要多國語言智能語音技術支持的中國企業(yè)提供了最豐富與最有力的能力支撐。此次,靈云平臺推出多語種語音合成技術,適逢靈云慶祝誕生兩周年之際,猶如為中國企業(yè)與社會大眾獻上了一份豐厚的大禮!
值得指出的是,此次捷通華聲靈云推出多語種語音合成技術云服務,與兩周前推出的覆蓋92種語言手寫識別技術,可謂“珠聯(lián)璧合”,說明靈云平臺已開始具備服務全球的基本能力,為助力中國企業(yè)進軍國際市場、全面參與國際競爭做好越來越充足的HCI技術能力支撐準備。相信也會對促進中國與國際間的交流合作做出貢獻。
靈云平臺是一個開放的平臺,也是一個企業(yè)間合作的平臺。未來發(fā)展,捷通華聲靈云將在發(fā)揮智能語音等多項HCI技術優(yōu)勢的基礎上,不斷與國內(nèi)外學術界、產(chǎn)業(yè)界、包括國際跨國企業(yè)進行合作,力爭通過全球范圍的合作,為世界各國用戶提供更多、更好、更全面的HCI技術能力,將合作共贏的理念通過HCI技術融入中國IT產(chǎn)業(yè),也融入世界!
捷通華聲靈云:源自中國,服務全球!
感知靈云,從這里開始,靈云智能人機交互技術試用體驗入口:www.hcicloud.com