中文字幕无码久久精品,13—14同岁无码A片,99热门精品一区二区三区无码,菠萝菠萝蜜在线观看视频高清1

您當前的位置是:  首頁 > 資訊 > 國內(nèi) >
 首頁 > 資訊 > 國內(nèi) >

標貝科技語音庫|模仿童聲、中文女聲情感數(shù)據(jù)庫

--分為喜、怒、哀、驚、懼、厭六種情感的表達

2020-04-24 10:45:51   作者:   來源:CTI論壇   評論:0  點擊:


  語音合成技術(shù)的推廣應(yīng)用,對語音合成的質(zhì)量提出了更高的要求。如何進一步提高語音合成的表現(xiàn)力,特別是讓合成語音能夠模擬表達說話人的情感狀態(tài),是語音合成未來發(fā)展的趨勢,也是語音合成研究領(lǐng)域所面臨的一個難題。而情感語音庫是語音合成技術(shù)的基礎(chǔ),也是決定語音合成效果的關(guān)鍵因素。
(點擊試聽情感效果)
  模仿童聲—情感音庫
  【模仿童聲DB-6-情感音庫】采集對象為標準普通話女聲模仿兒童,聽感活潑甜美。分為喜、怒、哀、驚、懼、厭六種情感的表達。錄制環(huán)境為專業(yè)錄音室和錄音軟件,錄音環(huán)境和設(shè)備自始至終保持不變,錄音環(huán)境的信噪比不低于35dB;單聲道錄音,用48KHz16比特采樣頻率、PCMWAV格式。錄音語料為中文,利于各情感的表達,并對音節(jié)、音子、韻律等在有限語料基礎(chǔ)上做了盡可能全面的覆蓋。根據(jù)合成語音標注標準,依據(jù)發(fā)音人實際發(fā)音對音庫進行文本音字校對、韻律層級標注。
 。c擊試聽情感效果)
  數(shù)據(jù)應(yīng)用場景
  本語音數(shù)據(jù)庫應(yīng)用廣泛,可用于以下方面:
  1.科研,可用于語音合成系統(tǒng)模型訓練;
  2.有聲讀物;
  3.生活出行;
  3.智能科技;
  4.教育、娛樂等。
  技術(shù)參數(shù)

數(shù)據(jù)規(guī)格

數(shù)據(jù)內(nèi)容

中文女聲DB-6情感音庫數(shù)據(jù)

錄音語料

6種情感各2000句語料(喜、怒、哀、驚、懼、厭)

有效時長

14成品小時(12000句)

平均字數(shù)

15/

語言類型

標準普通話

發(fā)音人

女;20-30歲;聲音溫柔親切

錄音環(huán)境

聲音采集環(huán)境為專業(yè)錄音棚環(huán)境

1)        錄音棚符合專業(yè)音庫錄制標準;

2)        錄音環(huán)境和設(shè)備自始至終保持不變;

3)        錄音環(huán)境的信噪比不低于35dB

錄制工具

專業(yè)錄音設(shè)備及錄音軟件

采樣格式

無壓縮PCM WAV格式,采樣率為48KHz、16bit。

標注內(nèi)容

中文音字標注、韻律標注、聲韻母邊界標注

標注格式

文本標注為.txt格式文檔;邊界標注為.interval格式文檔

質(zhì)量標準

1. 語音文件為48k 16bit wav格式,音色、音量、語速一致,無截幅;

2.標注文件字準率不低于99.8%;

3.韻律無明顯不合理標注錯誤;

4.音素邊界錯誤大于10ms的比例小于1%;音節(jié)邊界準確率大于98%.

存儲方式

本地FTP存儲

文件格式

音頻文件:WAV 文本標注文件:TXT 邊界標注文件:INTERVAL

數(shù)據(jù)脫敏

數(shù)據(jù)敏感項

產(chǎn)品應(yīng)用

適用領(lǐng)域

科研、智能科技、生活、教育、娛樂等多領(lǐng)域應(yīng)用

版權(quán)歸屬

版權(quán)所有者

標貝(北京)科技有限公司

  中文女聲—情感音庫
  【中文女聲DB-6情感音庫】采集對象為標準普通話女聲,分為喜、怒、哀、驚、懼、厭六種情感的表達。錄制環(huán)境為專業(yè)錄音室和錄音軟件,錄音環(huán)境和設(shè)備自始至終保持不變,錄音環(huán)境的信噪比不低于35dB;單聲道錄音,用48KHz16比特采樣頻率、PCMWAV格式。錄音語料為中文,利于各情感的表達,并對音節(jié)、音子、韻律等在有限語料基礎(chǔ)上做了盡可能全面的覆蓋。根據(jù)合成語音標注標準,依據(jù)發(fā)音人實際發(fā)音對音庫進行文本音字校對、韻律層級標注、聲韻母邊界標注。
(點擊試聽情感效果)
  數(shù)據(jù)應(yīng)用場景
  本語音數(shù)據(jù)庫應(yīng)用廣泛,可用于以下方面:
  1.科研,可用于語音合成系統(tǒng)模型訓練;
  2.有聲讀物;
  3.生活出行;
  3.智能科技;
  4.教育、娛樂等。
  技術(shù)參數(shù)

數(shù)據(jù)規(guī)格

數(shù)據(jù)內(nèi)容

模仿童聲DB-6情感音庫數(shù)據(jù)

錄音語料

6種情感各2000句語料

有效時長

14成品小時(12000句)

平均字數(shù)

15/

語言類型

標準普通話

發(fā)音人

女聲模仿兒童,活潑甜美風格

錄音環(huán)境

聲音采集環(huán)境為專業(yè)錄音棚環(huán)境

1)        錄音棚符合專業(yè)音庫錄制標準;

2)        錄音環(huán)境和設(shè)備自始至終保持不變;

3)        錄音環(huán)境的信噪比不低于35dB。

錄制工具

專業(yè)錄音設(shè)備及錄音軟件

采樣格式

無壓縮PCM WAV格式,采樣率為48KHz、16bit

標注內(nèi)容

中文音字標注、韻律標注

標注格式

文本標注為.txt格式文檔

質(zhì)量標準

1.語音文件為48k 16bit wav格式,音色、音量、語速一致,無截幅;

2.標注文件字準率不低于99.8%

3.韻律無明顯不合理標注錯誤。

存儲方式

本地FTP存儲

文件格式

音頻文件:WAV 文本標注文件:TXT

數(shù)據(jù)脫敏

數(shù)據(jù)敏感項

產(chǎn)品應(yīng)用

適用領(lǐng)域

科研、智能科技、生活、教育、娛樂等多領(lǐng)域應(yīng)用

版權(quán)歸屬

版權(quán)所有者

標貝(北京)科技有限公司

 

【免責聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

相關(guān)熱詞搜索: 標貝科技 語音合成 TTS

上一篇:Zoom并不想成為網(wǎng)紅公司

下一篇:最后一頁

專題

CTI論壇會員企業(yè)