作為第二屆數(shù)字中國建設峰會的重點,本次大賽主要圍繞大數(shù)據(jù)、人工智能、工業(yè)互聯(lián)網(wǎng)等新一代信息技術展開,而華為作為大賽的出題方之一,提出了賽題“文化傳承——漢字書法多場景識別”。
2019(首屆)數(shù)字中國創(chuàng)新大賽啟動新聞發(fā)布會現(xiàn)場
作為此次大賽的出題方,華為在確定賽題過程中主要考慮兩個大方向:
- 一是偏向AI技術領域,聚焦人工智能領域中語音、語義、圖像、人臉識別等技術的運用;
- 二是偏向行業(yè)場景,例如人工智能在天氣預測、提高生產(chǎn)效率等方面的具體應用。最終,圍繞“數(shù)字中國”主題以及實現(xiàn)社會效益的目標,經(jīng)過長時間的謹慎而全面的內(nèi)部討論,華為將此次賽題最終確定為:文化傳承——漢字書法多場景識別。
書法是中國文化的符號,需要不斷傳承并發(fā)揚光大。然而,生活場景下的風景名勝里的碑刻,建筑上的題詞、對聯(lián)、牌匾,博物館里的字畫作品,甚至尋常家居里懸掛的書法字畫等,對于小年輕而言越來越難以識別。
我們的技術工程師中也有很多傳統(tǒng)文化愛好者,想到如果可以利用先進的AI技術,實時、準確、自動地識別出這些書法文字,對于記錄整理書法藝術和傳播書法背后的中國文化有著重要的社會價值。華為云EI服務產(chǎn)品部營銷總監(jiān)桑宏宇強調(diào)。
目前,利用人工智能技術進行手寫中文識別已經(jīng)有了很大的突破,有很好的準確率。而華為云EI的文字識別服務(OCR)已經(jīng)在各行各業(yè)中得到了很好的應用:
- OCR已經(jīng)在幫助德邦等物流公司識別快遞單,實現(xiàn)快遞信息的高效精準數(shù)字化;
- OCR在醫(yī)療機構中能識別各種醫(yī)學化驗單,實現(xiàn)醫(yī)學檢驗化驗信息的高效精準數(shù)字化;
- OCR還能幫助保險公司識別各種保單,實現(xiàn)保單信息高效精準的數(shù)字化。
長按二維碼了解華為云EI 文字識別服務(OCR)
如何幫助德邦物流解決快遞單號問題
華為云EI服務在各行業(yè)的應用極大提升了各行業(yè)的生產(chǎn)效率,降低了成本,為企業(yè)的智能化發(fā)展奠定了堅實基礎。桑宏宇提到,“華為云EI的OCR服務在企業(yè)應用時,我們發(fā)現(xiàn)很多行業(yè)有手寫體識別的需求,而整個AI行業(yè)中手寫體的識別精度都有很大的提升空間。”
“文化傳承——漢字書法多場景識別”賽題涉及到對多種技術的考察,例如包括圖像描述、圖像檢測、圖像編碼、圖像分割等圖像處理技術,包括深度學習理論、算法和神經(jīng)網(wǎng)絡的深度學習技術和包括需求分析、方案設計、編碼、測試等計算編程技術。
同時,該賽題對于參賽者的考察也是全面系統(tǒng)化的,參賽者需要了解深度學習模型,例如深度神經(jīng)網(wǎng)絡(DNN:Deep Neural Networks),能根據(jù)實際問題選擇合適的模型。熟悉 Tensorflow,Pytorch等框架,能根據(jù)實際問題選擇合適的框架,并使用框架能力進行模型訓練和應用開發(fā)。
談及本次賽題的最大難點,在于:書法背景多樣化和字體風格多樣化帶來的AI識別挑戰(zhàn)。
以福字來舉個栗子:
從古漢字演變到如今,它的形態(tài)發(fā)生了眾多的變化。光是形態(tài)就就多達百種以上,更別說不同材質(zhì)飽經(jīng)時間風霜帶來的顏色不均衡、小面積被腐蝕等調(diào)整了。
在以判斷AI文字識別的準確率為主要衡量依據(jù)的背景下,考慮到相對較短的比賽時間、任務完成量以及任務難度,也為了鼓勵更多參賽者愿意參賽、能夠參賽,桑宏宇表示將會適當降低賽題門檻,對賽題中書法場景和字體作出限定,避免將比賽的AI設計變成一個龐大的系統(tǒng)工程。
桑宏宇提出:
“AI(人工智能)作為驅(qū)動‘數(shù)字中國’建設的核心技術之一,如何能夠快速普及和應用一直是困擾大家的難點問題。華為云就是想讓現(xiàn)在‘高高在上’的AI變成大家都可以‘用得起、用得好、用得放心’的普惠AI。”
基于華為云EI的能力和實踐經(jīng)驗,與開發(fā)者一起推動人工智能產(chǎn)業(yè)創(chuàng)新和發(fā)展,加速推進普惠AI落地,不再讓AI技術成為高高在上的象牙塔,真正推進AI技術在某領域的普及和應用,是華為云的初衷。同時,華為也希望通過這次大賽,利用AI技術幫助解決社會或者大家實際生活碰到的問題,為整個社會造福。
華為在作為本次大賽出題方的同時,也會扮演導師的角色,并為參賽者提供技術和平臺支持。此次大賽,華為推薦參賽者使用華為云今年10月最新發(fā)布的普惠AI開發(fā)平臺——ModelArts平臺,幫助參賽者在克服人工智能難題過程中提升效率,改善效果。
ModelArts平臺提供自動學習、數(shù)據(jù)管理、開發(fā)管理、訓練管理、模型管理、推理服務管理、市場等多個模塊化的服務,具有上手快、訓練快、上線快特點。“相信未來開發(fā)者在使用華為云ModelArts開發(fā)人工智能應用時能夠得心應手。”桑宏宇說。
未來,華為也將致力于將優(yōu)秀比賽成果進行延伸開發(fā),以實際行動促進數(shù)字經(jīng)濟發(fā)展,為數(shù)字中國建設貢獻力量!