中文字幕无码久久精品,13—14同岁无码A片,99热门精品一区二区三区无码,菠萝菠萝蜜在线观看视频高清1

 首頁(yè) > 新聞 > 專家觀點(diǎn) >

2016語(yǔ)音技術(shù)產(chǎn)業(yè)一覽之輔助技術(shù)

2016-05-30 09:21:23   作者:   來(lái)源:CTI論壇   評(píng)論:0  點(diǎn)擊:


  CTI論壇(ctiforum.com)(編譯/老秦): 人類的聽(tīng)、說(shuō)、看的能力是上蒼賜予我們的禮物,而聽(tīng)力受損,語(yǔ)言障礙和部分或全部失明是人類每天都要面臨的挑戰(zhàn)。語(yǔ)音識(shí)別技術(shù)正在幫助解決大多數(shù)情況下的這些問(wèn)題。
  這些幫助改善“聽(tīng)、說(shuō)、看”能力的技術(shù)被人們寄予厚望,尤其在老齡化日益嚴(yán)重的今天。隨著年齡的增長(zhǎng),越來(lái)越多的人開(kāi)始發(fā)生這些類型的障礙。
\
  更具體地說(shuō),根據(jù)美國(guó)疾病控制和預(yù)防中心(CDC)的數(shù)據(jù),美國(guó)每年大約有750000人中風(fēng),又根據(jù)美國(guó)心臟協(xié)會(huì)(AHA)的數(shù)據(jù),由此每年造成的死亡人數(shù)為129000.其他的數(shù)據(jù)則聲稱美國(guó)每年中風(fēng)數(shù)高達(dá)100萬(wàn)。中風(fēng)在AHA的人類死亡原因中位列第五。根據(jù)美國(guó)國(guó)家失語(yǔ)癥協(xié)會(huì)和阿德勒失語(yǔ)癥中心的數(shù)據(jù),目前美國(guó)的失語(yǔ)人數(shù)分別是100萬(wàn)和200萬(wàn)。根據(jù)美國(guó)國(guó)家失語(yǔ)癥協(xié)會(huì)的數(shù)據(jù),每年有超過(guò)80000的美國(guó)人被診斷為失語(yǔ)癥。根據(jù)疾病防治中心的說(shuō)法,目前有超過(guò)1000萬(wàn)的美國(guó)人患有認(rèn)知障礙。醫(yī)療保健的支出在美國(guó)和世界各地都呈上升趨勢(shì),所以有更多的人比以往任何時(shí)候都更加需要獲得“聽(tīng)、說(shuō)、看”輔助設(shè)備。
  歷史最悠久、最公開(kāi)的語(yǔ)音技術(shù)是語(yǔ)音合成技術(shù),世界著名的物理學(xué)家和作家斯蒂芬·霍金利用這種技術(shù)進(jìn)行交流?▋(nèi)基梅隆大學(xué)消費(fèi)者科學(xué)教授Alan Black說(shuō),霍金使用的是某些30年前開(kāi)發(fā)的基本系統(tǒng),這些系統(tǒng)是為了那些失去了他們的聲音和那些從來(lái)沒(méi)有聲音的人們而開(kāi)發(fā)的。
  通過(guò)使用一個(gè)嵌入在他的臉頰中的小傳感器激活,霍金“類型”字符和數(shù)字通過(guò)一個(gè)語(yǔ)音生成設(shè)備(SGD)產(chǎn)生出經(jīng)過(guò)合成過(guò)的語(yǔ)言;艚鸬脑O(shè)備是由now-defunct Speech Plus。開(kāi)發(fā)的。這家公司是目前這類設(shè)備的最大制造商,位于美國(guó)的匹茲堡。它是基于DynaVox公司的LLC系統(tǒng),一家Tobii科技公司。
  霍金的設(shè)備使用了一個(gè)具有美國(guó)口音的機(jī)器人聲,而霍金是英國(guó)人,DynaVox公司和其他公司提供各種各樣的聲音,以便可以合成個(gè)性化的語(yǔ)言。
  租賃你自己的聲音
  進(jìn)一步的幾個(gè)步驟使輔助語(yǔ)音系統(tǒng)利用你自己的聲音錄音,這樣復(fù)制的演講聽(tīng)起來(lái)就像個(gè)人在使用設(shè)備。
  這樣的設(shè)備在市場(chǎng)上最著名的就是影評(píng)人羅杰·艾伯特(Roger Ebert)使用的了,他是第一個(gè)使用語(yǔ)音合成器發(fā)出伊利諾伊英國(guó)口音的人。艾伯特因?yàn)榘┌Y切除了他的下巴,從而失去了說(shuō)話的能力。
  艾伯特最終被CereProc CereVoiceMe的聲音克隆服務(wù)所吸引。起初他不喜歡它,因?yàn)樗徽J(rèn)為這個(gè)聲音聽(tīng)起來(lái)像他自己的聲音,盡管它來(lái)自于30年代的電視節(jié)目和廣播節(jié)目錄音。艾伯特不認(rèn)為聲音是他自己的原因是因?yàn)槟沅浿频穆曇舨煌谀闼?tīng)到的聲音。當(dāng)你說(shuō)話的時(shí)候,是頭骨和鼓膜振動(dòng)的合成。聽(tīng)錄音時(shí),只聽(tīng)到通過(guò)鼓膜振動(dòng)的那部分。
  那些知道正在失去講話能力的人們往往會(huì)利用今天不同公司所提供的語(yǔ)音克隆技術(shù)記錄幾個(gè)小時(shí)自己的聲音。通常,更多的記錄時(shí)間可以使自己的聲音更自然的再現(xiàn),也會(huì)因?yàn)楦嗟脑~形變化和其他說(shuō)話時(shí)的細(xì)微差別而原音重現(xiàn)。當(dāng)然,更強(qiáng)大的解決方案所需費(fèi)用也更高。
  Lingraphica最近增加了即時(shí)消息和電子郵件功能,這給它的7英寸minitalk模型機(jī)和13英寸筆記本電腦模型機(jī)帶來(lái)了每日新聞?wù)?/div>
  “這是一個(gè)非常有趣的時(shí)代,而我們公司有著獨(dú)特的優(yōu)勢(shì),”Lingraphica公司創(chuàng)新、銷售和營(yíng)銷部門副總裁Michelle Hart-Henry根據(jù)前面提到的健康數(shù)據(jù)評(píng)論道。該公司為語(yǔ)言障礙提供設(shè)備和語(yǔ)言治療解決方案,致力于解決那些康復(fù)問(wèn)題。
  “中風(fēng)的發(fā)病率增長(zhǎng),而存活率也增加了,”Hart-Henry說(shuō)。“同時(shí),人們正越來(lái)越相信中風(fēng)六個(gè)月后恢復(fù)的可能性。”
  隨著新生代的增長(zhǎng),這樣的認(rèn)知問(wèn)題也將繼續(xù)增加,Hart-Henry補(bǔ)充道。“他們需要這些設(shè)備。如果他們沒(méi)有這樣的需求,他們的孩子們也會(huì)有。他們希望處于不斷發(fā)展的技術(shù)之巔。”
  超出了公司的傳統(tǒng)產(chǎn)品,Hart-Henry期望她的公司和其他公司為語(yǔ)言障礙群體提供技術(shù)和環(huán)境以及其他科技設(shè)備,讓人們?cè)谌粘I钪械玫绞褂谩?/div>
  通過(guò)電話幫助聽(tīng)障群體自由溝通
  盡管今天的消費(fèi)者使用智能手機(jī)的時(shí)間遠(yuǎn)遠(yuǎn)超過(guò)了使用普通電話,但對(duì)于許多人來(lái)說(shuō),電話仍然是重要的,尤其是當(dāng)與朋友和家人交流的時(shí)候,RogerVoice的CEO Olivier·Jeannel如是說(shuō)。這家公司提供了幫助聽(tīng)力受損群體在電話溝通時(shí)的解決方案。
  利用與谷歌語(yǔ)音的接口,為這些客戶提供了字幕服務(wù)。產(chǎn)品的市場(chǎng)相對(duì)較小,根據(jù)Jeannel的說(shuō)法,有聽(tīng)力損失的百分之一和有深度或聽(tīng)力完全損失的千分之一的人群才會(huì)用到這項(xiàng)服務(wù)。
  利用RogerVoice的產(chǎn)品和服務(wù),耳背的人可以使用電話聯(lián)系親人,在這里電話仍然是主要的通信工具---- 百分之九十的電話都是打給朋友和家人的,Jeannel說(shuō)。
  雖然幫助聽(tīng)力受損人群溝通的技術(shù)是基于提供字幕服務(wù),一個(gè)不同的技術(shù)則來(lái)自于MotionSavvy UNI,它結(jié)合了手勢(shì)和語(yǔ)音識(shí)別技術(shù),將手語(yǔ)翻譯成語(yǔ)音。該技術(shù)有望在2016年中期實(shí)現(xiàn)。
  Ava,一項(xiàng)使用語(yǔ)音技術(shù)的字幕工具,預(yù)計(jì)也將在2016年的某個(gè)時(shí)期首次亮相。
  新的、更強(qiáng)大的技術(shù)幫助視力受損群體
  視障需要朗讀文本的技術(shù),今天這個(gè)功能可在大多數(shù)操作系統(tǒng)上實(shí)現(xiàn),Black說(shuō)。應(yīng)用程序有能力跳過(guò)廣告并提供基于屏幕文本的快速語(yǔ)音交流。
  Nuance的TALKS軟件應(yīng)用程序?qū)⑽谋巨D(zhuǎn)換為可理解的語(yǔ)音,這個(gè)應(yīng)用程序是與Nuance ZOOMS的緊密集成,屏幕放大器應(yīng)用程序使得低視力用戶手機(jī)可以訪問(wèn)手機(jī)屏幕上的內(nèi)容。
  還有一些為盲人服務(wù)的先進(jìn)技術(shù),從簡(jiǎn)單的閱讀屏幕上的文字到對(duì)于在屏幕上的圖片內(nèi)容進(jìn)行描述。
  Conversant的創(chuàng)始人兼首席執(zhí)行官ChrisoMaury,四年前逐漸視力減弱,他很不滿意當(dāng)時(shí)他在市場(chǎng)上看到的技術(shù)和產(chǎn)品,因?yàn)樗胍牟粌H僅是語(yǔ)音。“我想構(gòu)建我想要的東西。”
  所以他發(fā)明了SayKit軟件開(kāi)發(fā)工具包(SDK),一個(gè)面向C語(yǔ)言和Swift框架的,增加了與iOS應(yīng)用程序的會(huì)話交互。SDK使用會(huì)話語(yǔ)音,使應(yīng)用程序用戶可以簡(jiǎn)單地說(shuō)“搜索…”,而不是提供更少的自然語(yǔ)音指令。
  “這將是未來(lái)的客戶互動(dòng),”Maury說(shuō)。
  Conversant最近與Target聯(lián)合發(fā)布了一個(gè)應(yīng)用程序,名為Say Shopping,它使用戶能夠說(shuō)出他們想要的產(chǎn)品。這款應(yīng)用程序搜索Target的整個(gè)產(chǎn)品目錄,使用戶能夠聽(tīng)到關(guān)于產(chǎn)品的詳細(xì)信息和用戶評(píng)論?蛻艨梢杂嗁(gòu)產(chǎn)品。Conversant正與Target一起研發(fā)如何為購(gòu)買雜貨的顧客服務(wù)。
  根據(jù)Maury的說(shuō)法,此應(yīng)用程序已經(jīng)被下載它的人群中的一半以上的人所使用。
   聲明:版權(quán)所有 非合作媒體謝絕轉(zhuǎn)載
分享到: 收藏

專題