天網(wǎng)恢恢,疏而不漏。不法分子的“易容術(shù)”、3D面具、圍巾帽子加口罩等偽裝,均逃不過人工智能監(jiān)控的“透視眼”……
方象知產(chǎn)研究院梳理了“視覺”安防領(lǐng)域傳統(tǒng)巨頭和創(chuàng)新企業(yè)的發(fā)展情況和特點;本期文章將繼續(xù)篩選和解析這些企業(yè)在“計算機視覺+安防”領(lǐng)域的高價值核心技術(shù),一窺“大佬”和“萌新”們的獨門秘笈及發(fā)展方向,以期為相關(guān)企業(yè)和投資機構(gòu)未來布局、決策提供參考。
傳統(tǒng)安防巨頭 不止于“看得清”
在技術(shù)迅速發(fā)展和迭代的今天,傳統(tǒng)安防巨頭既不忘初心,又與時俱進,在不斷提升原有監(jiān)控前端產(chǎn)品性能指標(biāo)的同時,積極運用人工智能技術(shù)革新產(chǎn)品序列,確保在穩(wěn)守“根據(jù)地”的基礎(chǔ)上,繼續(xù)開疆拓土。
?低—監(jiān)控攝像機能自動聚焦
作為傳統(tǒng)安防三巨頭,?低、大華科技和宇視科技早已克服了模擬監(jiān)控、數(shù)字監(jiān)控等畫面不清晰、不易存儲讀取等問題,并手握相關(guān)核心技術(shù)。
監(jiān)控攝像機拍攝圖像時,如果不經(jīng)常調(diào)節(jié)鏡頭,無法快速、準(zhǔn)確、平穩(wěn)自動對焦。
針對這一問題,?低曆邪l(fā)了具有“自適應(yīng)聚焦技術(shù)” 的攝像裝置,攝像機針對同一場景,可以自動選擇合適的聚焦模式,從而構(gòu)建了清晰度評價準(zhǔn)則。
這種自適應(yīng)聚焦方法(見圖 1),針對不同模糊程度的圖像及聚焦參考值,設(shè)計了相應(yīng)的“自適應(yīng)步長策略”,能夠更快速、準(zhǔn)確驅(qū)動步進電機對焦、減少震蕩。該項技術(shù)能讓視覺前端產(chǎn)品“看得更清”,因此在海康產(chǎn)品序列中被廣泛引用。
方象知產(chǎn)研究院分析發(fā)現(xiàn),?低曔@項技術(shù)的發(fā)明專利,被引用高達30多次,引用者不乏其競爭對手宇視科技、大華科技、華為等,足見該項技術(shù)的重要性。
除了海康威視,浙江大學(xué)、宇視科技等對該技術(shù)都有深入研究。
圖 1:攝像裝置自適應(yīng)聚焦技術(shù)原理
來源:方象知產(chǎn)研究院
大華科技—卷積神經(jīng)網(wǎng)絡(luò) 提高圖像識別率
在計算機視覺發(fā)展火熱的今天,安防巨頭并沒有躺在有傳統(tǒng)優(yōu)勢的硬件產(chǎn)品上“吃老本”,而是早早布局智能安防領(lǐng)域,以期在“看得清”的基礎(chǔ)上,讓視覺監(jiān)控智能化。而這些新技術(shù),也成為安防巨頭能為客戶提供整體安全解決方案的重要基礎(chǔ)。
2018年12月11日,大華科技公開的一篇專利顯示,該公司針對在海量視頻圖像中,如何判斷優(yōu)選圖像,布局了核心技術(shù)。該技術(shù)運用預(yù)先訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)評價模型,對圖像進行包括殘缺度、目標(biāo)物體與所在圖像的垂線角度、目標(biāo)占圖像面積比、圖像清晰度、圖像亮暗度等參數(shù)進行評價,最終選出滿足預(yù)設(shè)條件的優(yōu)選圖像。比如在交管應(yīng)用方面,這一技術(shù)能提高低質(zhì)量車輛圖像的識別,提高圖像數(shù)據(jù)利用率。
宇視科技—智能回放 能自動挑選動態(tài)視頻分析
又如宇視科技,在視頻存儲與播放領(lǐng)域布局了一系列技術(shù),專利被引用數(shù)量超過20次。其中的視頻智能回放方法,可以將視頻錄像劃分為多個視頻片段,通過篩選出具有運動目標(biāo)的視頻段回放,以便更準(zhǔn)確、快速對錄像進行分析。這項技術(shù),解決了后端分析浪費智能服務(wù)器、智能網(wǎng)絡(luò)硬盤錄像機(NVR)、處理結(jié)果時間長的痛點。
傳統(tǒng)安防巨頭布局智能監(jiān)控,在重要技術(shù)熱點上,不同公司通過不同方法解決問題。結(jié)合深度學(xué)習(xí)算法,智能視頻技術(shù)使攝像機不單純具有“眼睛”的功能,更具有“大腦”的特點。以此為支撐的計算機視覺安防系統(tǒng)解決方案,可廣泛用于安防布控、罪犯抓捕及大型活動安保等領(lǐng)域。
新興創(chuàng)企 特定角度切入研發(fā)“看穿你”
作為后起之秀,眾多創(chuàng)企率先將計算機視覺技術(shù)落地到安防領(lǐng)域。在傳統(tǒng)硬件設(shè)備和市場渠道等方面,創(chuàng)業(yè)公司無法與傳統(tǒng)安防巨頭匹敵,因此,它們大多瞄準(zhǔn)了智能安防這一創(chuàng)新技術(shù)領(lǐng)域。而人臉識別,不約而同成為多家創(chuàng)業(yè)公司“夢開始的地方”。
人臉識別技術(shù)發(fā)展的過程中,諸多痛點問題顯現(xiàn):比如對于通過化妝、“易容”等偽造生物特征的目標(biāo),不能完全識別;比如在大規(guī)模人員移動、人流量密集等情況,因監(jiān)控圖片質(zhì)量下降造成識別困難;還有對目標(biāo)人群識別的視頻切割處理不靈活,導(dǎo)致完整行為信息缺乏等。
針對這些痛點問題,創(chuàng)新公司依托強大的研發(fā)能力,接連攻克核心技術(shù),通過技術(shù)優(yōu)勢,不僅在安防市場中搶得一席之地,業(yè)務(wù)范圍還拓展到金融、智慧城市等其他領(lǐng)域。
深醒科技—雙路神經(jīng)網(wǎng)絡(luò) 能識別“易容術(shù)”
在人臉識別中,可能有不法分子通過用照片、3D人臉面具偽造生物特征避免被查。針對這類問題,深醒科技提出利用兩個卷積神經(jīng)網(wǎng)絡(luò)進行人臉驗證:其中一個神經(jīng)網(wǎng)絡(luò)提取臉部多個子區(qū)域的局部特征(如眼部子區(qū)域,鼻部子區(qū)域等);另一個神經(jīng)網(wǎng)絡(luò)提取深度特征,通過深度圖譜驗證輸入圖像是否為實體,是否匹配一致。
雙路神經(jīng)網(wǎng)絡(luò),分別識別局部特征和整體深度特征,對局部特征和深度特征比較判別,實現(xiàn)真人面部識別,同時能夠有效識別照片、視頻、3D面具等反偵察欺騙手段。在圖像采集方面,紅外攝像頭和可見光攝像頭同時采集圖像,為進一步識別判定提供基礎(chǔ)。
商湯科技—智能監(jiān)控“透視眼” 能“看穿”戴口罩的臉
在火車站、商圈等人流密集場所,人員流動性較強、情況復(fù)雜,給追查犯罪分子、重點人員布控造成困難。專注于機器視覺的商湯科技,針對上述問題研發(fā)了基于深度學(xué)習(xí)和大規(guī)模集群的智能人臉追逃系統(tǒng)(見圖 2)。
該系統(tǒng)利用百萬級的數(shù)據(jù)集對神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,大大提高誤報警率與漏檢率,能夠有效克服面部受遮擋、陽光等強光源照射等外界因素對圖片采集的影響。同時,該技術(shù)支持多機多路和一機多路處理數(shù)據(jù)。如果人臉數(shù)據(jù)庫較小,可將人臉識別服務(wù)器部署在同一個物理服務(wù)器上,從而實現(xiàn)一機多路。如果人臉數(shù)據(jù)庫較大,為了提高處理效率,可將人臉識別服務(wù)器部署在不同的物理服務(wù)器上,從而實現(xiàn)多機多路。
圖 2:智能人臉追逃系統(tǒng)技術(shù)原理
來源:方象知產(chǎn)研究院
窺一斑見全豹。各創(chuàng)業(yè)公司在安防落地場景中,通常針對不同的細(xì)分應(yīng)用領(lǐng)域深耕,以解決傳統(tǒng)方法無法克服的問題為切入點,以數(shù)據(jù)集大、計算速度快、非線性適應(yīng)性強等優(yōu)勢,為計算機視覺打造一顆“智能大腦”,利用學(xué)習(xí)的方式,“教會”前后端設(shè)備“認(rèn)得清”、“看得懂”。
其實在計算機視覺領(lǐng)域,除了人臉識別以外,行為識別也是廣為應(yīng)用的技術(shù)之一。眾多科技公司在該技術(shù)分支上紛紛布局,方象知產(chǎn)研究院以后會就此單獨進行分析。
“巨頭”“萌新” 均重視布局存儲技術(shù)
大數(shù)據(jù)是人工智能的基礎(chǔ)。在數(shù)據(jù)就是黃金的今天,隨著監(jiān)控網(wǎng)點急速擴展,視頻和卡口產(chǎn)生海量數(shù)據(jù)。如何安全存儲、高效查找,成為“視覺”安防未來發(fā)展不可或缺的支柱性技術(shù)之一。“大佬”和“萌新”們也都意識到這個問題,針對視頻存儲、編碼解碼進行了大量的研究工作(見表1)。
方象知產(chǎn)研究院列出了部分公司較為重要或具有代表性的專利。受篇幅所限,本文不做過多解讀。
表1:各公司與計算機視覺相關(guān)存儲技術(shù)專利
來源:方象知產(chǎn)研究院
上述存儲技術(shù),主要針對大數(shù)據(jù)的存儲安全、升級安全、丟失恢復(fù)、容錯能力及讀取能力,結(jié)合分布式存儲、云平臺等方法,將各類信息分門別類存儲。不同公司雖然有不同的算法,但殊途同歸,都要解決數(shù)字存儲中高效與安全的問題。
方象技術(shù)觀察
布局特定場景及行為識別 搶占技術(shù)前沿
中國電子學(xué)會的公開數(shù)據(jù)顯示, 2017 年,中國人工智能核心產(chǎn)業(yè)規(guī)模已達到 56 億美元左右,預(yù)計 2020年將超過 220 億美元。在人工智能中,機器視覺占比最高,達到 37%。而在機器視覺市場中,安防行業(yè)占據(jù)七成份額。
目前,隨著安防建設(shè)升級,安防系統(tǒng)正從傳統(tǒng)的被動防御體系升級成為主動判斷和預(yù)警的智能防御。這種安防建設(shè)的升級,對智能安防也提出了更高要求。那么,從被動追逃到主動預(yù)警再到多場景應(yīng)用,視覺安防技術(shù)會如何發(fā)展呢?
視覺安防離不開卷積神經(jīng)網(wǎng)絡(luò)算法
在“計算機視覺+安防”領(lǐng)域,無論是智能視頻監(jiān)控,還是人臉識別或行為識別,歸根結(jié)底,本質(zhì)上都是對圖像進行處理。自2012年以來,在圖像處理問題上,卷積神經(jīng)網(wǎng)絡(luò)因其在學(xué)習(xí)過程中無需手工選取特征,只需進行大量圖像數(shù)據(jù)訓(xùn)練即可,在圖像分割、圖像檢測等方面取得巨大成果。目前,卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)成為圖像識別領(lǐng)域的核心算法之一。
根據(jù)人類視覺系統(tǒng)[1]對信息分級處理的方式,人工構(gòu)建的深度卷積神經(jīng)網(wǎng)絡(luò)模型,可以仿照人類大腦,由低層到高層逐層迭代、抽象處理視覺信息。卷積網(wǎng)絡(luò)每層代表可視皮層的區(qū)域,每層上的節(jié)點代表可視皮層區(qū)域上的神經(jīng)元,信息由左向右,逐層迭代傳播。通過對歷史數(shù)據(jù)逐步進行學(xué)習(xí),將歷史數(shù)據(jù)的經(jīng)驗存儲在網(wǎng)絡(luò)中,且伴隨著學(xué)習(xí)次數(shù)及經(jīng)驗不斷提高,可指數(shù)型跨越式地提升計算機對圖像和視頻的認(rèn)知能力。
。1]1981年諾貝爾醫(yī)學(xué)獎獲獎?wù)逥avid Hubel、Torsten Wiesel發(fā)現(xiàn)
特定場景和行為識別是重要技術(shù)靶點
深度依托于圖像處理的“安防”,最先得到了技術(shù)發(fā)展的紅利,傳統(tǒng)安防巨頭和創(chuàng)企紛紛致力于打造具有“智能大腦”的算法、設(shè)備和系統(tǒng)。
雖然深度卷積網(wǎng)絡(luò)的多重非線性使其具有很大的可塑性,但想要將這把利器恰到好處地用到安防場景,還需更多研究和實踐。
在深度網(wǎng)絡(luò)框架下,如何選擇內(nèi)部結(jié)構(gòu),引入多少節(jié)點,選取哪些區(qū)域進行池化,往往需要大量經(jīng)驗,還要反復(fù)進行調(diào)整。深度網(wǎng)絡(luò)“學(xué)習(xí)”的過程中,特寫場景中的目標(biāo)特征識別尤為重要。這需要對系統(tǒng)有針對性地喂以訓(xùn)練數(shù)據(jù),比如遮擋人臉、行為識別中各種組合姿態(tài)等,通過深度學(xué)習(xí),讓其能針對特寫場景中的目標(biāo)進行識別。
方象知產(chǎn)研究院認(rèn)為,在視覺安防領(lǐng)域,以卷積神經(jīng)網(wǎng)絡(luò)突破細(xì)分場景應(yīng)用,仍然是未來的發(fā)展方向:一方面能讓這種“類視覺人工智能系統(tǒng)”針對特定場景的目標(biāo)進行識別,不僅知道什么時候“該看”,還要能“看得清”、“看得透”、“看得懂”,在安防領(lǐng)域發(fā)揮作用;另一方面,還要完善深度網(wǎng)絡(luò)的學(xué)習(xí)能力,突破算法局限,能針對不同特點的數(shù)據(jù)庫及需求,建立對應(yīng)的識別能力,建立系統(tǒng)性的整體設(shè)計方案,以最低成本拓展應(yīng)用場景。