中文字幕无码久久精品,13—14同岁无码A片,99热门精品一区二区三区无码,菠萝菠萝蜜在线观看视频高清1

您當(dāng)前的位置是:  首頁 > 資訊 > 國內(nèi) >
 首頁 > 資訊 > 國內(nèi) >

案例實踐 | 焱融科技助力科大訊飛釋放大規(guī)模AI集群計算能力

2020-02-28 11:18:17   作者:   來源:CTI論壇   評論:0  點擊:


  科大訊飛在語音及語言、自然語言理解、機(jī)器學(xué)習(xí)推理及自主學(xué)習(xí)等領(lǐng)域保持著國際前沿技術(shù)水平,同時在機(jī)器翻譯、自然語言理解、圖像識別、圖像理解、知識圖譜、知識發(fā)現(xiàn)、機(jī)器推理等方向上也處于業(yè)界領(lǐng)先水平,是國內(nèi)當(dāng)之無愧的人工智能領(lǐng)頭羊。人工智能是高度依賴IT的行業(yè),大量數(shù)據(jù)和計算的強(qiáng)有力支撐,也成為成就科大訊飛技術(shù)領(lǐng)先性的重要因素。

  科大訊飛的數(shù)據(jù)平臺架構(gòu)和重點

  談到人工智能,不得不提深度學(xué)習(xí),如今通過深度學(xué)習(xí)技術(shù)來實現(xiàn)人工智能,已成為業(yè)界普遍接受的共識。深度學(xué)習(xí)概念,在上個世紀(jì)80年代就已經(jīng)被提出,但直到近些年才真正得以重視和應(yīng)用,其背后是因為深度學(xué)習(xí)所依賴的兩大要素(海量被標(biāo)記的數(shù)據(jù)和強(qiáng)大的算力)成為現(xiàn)實,人工智能實質(zhì)上變成了對數(shù)據(jù)的處理和計算的科學(xué)。科大訊飛人工智能的數(shù)據(jù)處理,也采用了業(yè)界主流的處理流程,可以通過下面的圖示來描述:

  在整個數(shù)據(jù)處理過程中,不同階段所使用的技術(shù),以及這些技術(shù)對數(shù)據(jù)訪問的要求都有差別。數(shù)據(jù)處理的各個階段及每個階段對數(shù)據(jù)的訪問特點如下圖所示:

  在數(shù)據(jù)準(zhǔn)備階段,科大訊飛采用Hadoop等大數(shù)據(jù)技術(shù)對數(shù)據(jù)進(jìn)行清洗;模型訓(xùn)練階段是整個處理過程的核心,它負(fù)責(zé)從海量數(shù)據(jù)的特征中通過深度學(xué)習(xí)算法,獲得可交付的模型,用于人工智能產(chǎn)品和方案中。

  科大訊飛的基礎(chǔ)架構(gòu)團(tuán)隊,需要為各個人工智能團(tuán)隊及業(yè)務(wù)部門提供穩(wěn)定、高性能的訓(xùn)練存儲平臺,同時管理近千臺高性能GPU服務(wù)器,訓(xùn)練使用的存儲平臺性能如何,直接影響業(yè)務(wù)部門的訓(xùn)練效率,是整個數(shù)據(jù)處理流程的重中之重,也是優(yōu)化訓(xùn)練平臺的切入點。

  為了滿足眾多人工智能業(yè)務(wù)部門訓(xùn)練的需要,科大訊飛用于模型訓(xùn)練的數(shù)據(jù)平臺必須具備以下特性:

  • 保證高帶寬、低延時的讀寫特性,從而為GPU服務(wù)器提供足夠的數(shù)據(jù)輸入,確保GPU的高效使用
  • 支持十億級別的小文件及部分大文件混合的讀寫場景,滿足大量特征文件或聚合后的文件存儲需求
  • 上層訓(xùn)練模型使用標(biāo)準(zhǔn)文件接口訪問數(shù)據(jù)
  • 能支持?jǐn)?shù)千臺高性能計算節(jié)點的并發(fā)訪問
  • 為逐步容器化的訓(xùn)練任務(wù)提供無縫數(shù)據(jù)訪問能力

  為什么選擇YRCloudFile

  作為訓(xùn)練的數(shù)據(jù)平臺

  焱融科技和科大訊飛從2019年開始,就進(jìn)行了多次的交流和實際測試?拼笥嶏w的技術(shù)團(tuán)隊對訓(xùn)練使用的存儲平臺選型非常重視,最為關(guān)注的是數(shù)據(jù)平臺的實際性能,包括大文件的隨機(jī)讀寫、小文件的讀寫性能;海量元數(shù)據(jù)的操作性能(creation、stat、removal等);海量文件的支持,以及在海量文件的背景下,數(shù)據(jù)訪問和操作性能是否保持一致;存儲平臺的穩(wěn)定性;在故障場景,尤其是元數(shù)據(jù)服務(wù)故障場景下,集群性能的穩(wěn)定性;與容器平臺的對接;數(shù)據(jù)生命周期的管理等多方面能力。這些嚴(yán)格的評估標(biāo)準(zhǔn),也是從實際業(yè)務(wù)的訴求和科大訊飛基礎(chǔ)架構(gòu)團(tuán)隊在多年的實際工作積累中提煉出來的。

  YRCloudFile在架構(gòu)上,可以完全與硬件解耦;在通用的服務(wù)器上就能充分發(fā)揮出高速存儲介質(zhì)和網(wǎng)絡(luò)的性能,相對于其它的存儲產(chǎn)品,性能領(lǐng)先數(shù)倍;元數(shù)據(jù)處理和訪問性能,在故障場景下,元數(shù)據(jù)的訪問性能尤為突出,充分滿足海量小文件的訪問需求和特點;在容器平臺對接、冷熱數(shù)據(jù)分層上具有特色鮮明的功能。綜合產(chǎn)品多方面的考量要素,YRCloudFile是最貼近科大訊飛訓(xùn)練數(shù)據(jù)平臺的高性能分布式文件存儲產(chǎn)品。

  在科大訊飛對焱融科技YRCloudFile進(jìn)行深入了解和測試之后,雙方達(dá)成了全面的合作。

  YRCloudFile在科大訊飛的運行狀況

  隨著科大訊飛和焱融科技的共同合作,YRCloudFile得以快速應(yīng)用在科大訊飛核心的大規(guī)模深度學(xué)習(xí)訓(xùn)練集群生產(chǎn)環(huán)境中。憑借YRCloudFile靈活的軟件部署架構(gòu)和界面化快速部署能力以及焱融科技的全方位售后服務(wù),從第一個YRCloudFile集群上線,到后續(xù)數(shù)個集群陸續(xù)部署,數(shù)據(jù)快速增長,只經(jīng)歷短短幾個月時間,總數(shù)據(jù)規(guī)模已達(dá)到近10PB,存放近百億用于訓(xùn)練的音頻、視頻、圖片文件,單集群峰值帶寬達(dá)近十GB/s,訓(xùn)練效率大幅提升。


  科大訊飛訓(xùn)練集群容量快速增長

  整個科大訊飛語音訓(xùn)練平臺服務(wù)于科大訊飛內(nèi)部人工智能研究院近千臺高性能計算服務(wù)器,大量科學(xué)家和算法工程師通過這些數(shù)據(jù)對模型進(jìn)行持續(xù)優(yōu)化,完成科大訊飛各類語音服務(wù)的產(chǎn)品輸出。

  在YRCloudFile服務(wù)科大訊飛過程中,焱融科技和科大訊飛的基礎(chǔ)架構(gòu)團(tuán)隊保持密切的溝通,通過數(shù)據(jù)IO模型特點的分析,焱融科技研發(fā)團(tuán)隊進(jìn)一步針對科大訊飛的數(shù)據(jù)特點對YRCloudFile進(jìn)行產(chǎn)品層面的優(yōu)化,由此形成了YRCloudFile部署->IO特點分析->讀寫優(yōu)化->更新上線的完整閉環(huán)。雙方技術(shù)團(tuán)隊,基于YRCloudFile在2019年的IO500測試中,獲得了全球第六的成績。

  YRCloudFile也通過在科大訊飛大規(guī)模的使用,快速積累更多服務(wù)人工智能企業(yè)高性能存儲場景的經(jīng)驗和能力,產(chǎn)品得到了進(jìn)一步的增強(qiáng),也證明了YRCloudFile的產(chǎn)品穩(wěn)定性及性能優(yōu)勢。

  YRCloudFile在科大訊飛未來的規(guī)劃

  目前YRCloudFile已經(jīng)為科大訊飛的訓(xùn)練集群提供了大規(guī)模的高性能數(shù)據(jù)服務(wù),接下來還會繼續(xù)擴(kuò)大在此場景下的使用。

  • YRCloudFile還提供了很好的云原生存儲的能力,包括支持容器跨節(jié)點重建、PVC Quota、PVC擴(kuò)容、PVC QoS、熱點分析等特性,也是國內(nèi)首個進(jìn)入CNCF LandScape的云原生存儲產(chǎn)品,因而,科大訊飛未來計劃將YRCloudFile進(jìn)一步應(yīng)用在內(nèi)部大量的云原生應(yīng)用場景中。
  • 焱融科技的技術(shù)團(tuán)隊還會開放更多的SDK,幫助科大訊飛將YRCloudFile整合到訊飛云平臺中,為更多業(yè)務(wù)提供基礎(chǔ)的共享文件系統(tǒng)服務(wù)。

  YRCloudFile給科大訊飛帶來的價值

  正如我們所介紹的那樣,海量數(shù)據(jù)和強(qiáng)大算力是深度學(xué)習(xí)得以發(fā)揮作用的兩大要素。YRCloudFile作為科大訊飛深度學(xué)習(xí)集群中所使用的高性能文件系統(tǒng),在提供人工智能基礎(chǔ)架構(gòu)的核心存儲服務(wù)的同時,也逐步體現(xiàn)出越來越大的商業(yè)價值。

  • 訓(xùn)練時間大幅縮短。相對于曾經(jīng)使用的其它商業(yè)存儲,YRCloudFile的高帶寬、低延時特性,能夠使GPU等計算服務(wù)器的計算效率達(dá)到飽和,從而將單次訓(xùn)練時間由一周縮短至數(shù)小時。
  • 訓(xùn)練精度提升。深度學(xué)習(xí)生成的模型會存在一定的偏差,算法工程師可以通過調(diào)整深度學(xué)習(xí)中的權(quán)重,不斷降低深度學(xué)習(xí)的成本函數(shù)(Cost Function),因此算法工程師需要對模型進(jìn)行多次迭代。由于單次訓(xùn)練時間的縮短,使算法工程師對模型進(jìn)行更多的迭代成為可能。迭代次數(shù)越多,輔以算法的優(yōu)化,使科大訊飛的訓(xùn)練精度得到不斷提升。

  總結(jié)

  目前,國內(nèi)的人工智能行業(yè)正迎來飛速發(fā)展的時機(jī),AI交通、AI醫(yī)療、AI政務(wù)、AI教育、自動駕駛等多個人工智能場景在不斷深入到我們的生活,YRCloudFile將幫助語音識別、視覺識別、自動駕駛等人工智能企業(yè)提升訓(xùn)練效率,增強(qiáng)人工智能企業(yè)的產(chǎn)品競爭力,從而更好地服務(wù)于更多的用戶。

  關(guān)于科大訊飛

  科大訊飛股份有限公司成立于1999年,是亞太地區(qū)知名的智能語音和人工智能上市企業(yè)。自成立以來,長期從事語音及語言、自然語言理解、機(jī)器學(xué)習(xí)推理及自主學(xué)習(xí)等核心技術(shù)研究并保持了國際前沿技術(shù)水平;積極推動人工智能產(chǎn)品研發(fā)和行業(yè)應(yīng)用落地,致力讓機(jī)器“能聽會說,能理解會思考”,用人工智能建設(shè)美好世界。2008年,公司在深圳證券交易所掛牌上市(股票代碼:002230)。

  關(guān)于焱融科技

  焱融科技是一家以軟件定義存儲技術(shù)為核心競爭力的高新技術(shù)企業(yè),在分布式存儲等關(guān)鍵技術(shù)上擁有自主知識產(chǎn)權(quán),是容器存儲的領(lǐng)導(dǎo)者。焱融科技針對各行業(yè)業(yè)務(wù)特性,打造個性化行業(yè)解決方案,提供一站式的產(chǎn)品與服務(wù)。焱融科技系列產(chǎn)品已服務(wù)于人工智能、金融、政府、制造業(yè)、互聯(lián)網(wǎng)等行業(yè)的眾多客戶。了解更多焱融科技信息,請訪問官網(wǎng)www.yanrongyun.com。

【免責(zé)聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

相關(guān)熱詞搜索: 焱融科技 科大訊飛 AI

上一篇:諾基亞推出端到端4G/5G新空口切片

下一篇:最后一頁

專題

CTI論壇會員企業(yè)