計算機視覺(也被稱為機器視覺)是人工智能技術(shù)最令人興奮的應用之一。該技術(shù)旨在“教”會計算機如何“看”世界,,它與自然語言處理及語音識別并列為機器學習領(lǐng)域的三大熱點方向,。■ 視覺中國供圖
計算機視覺技術(shù)囊括很多能夠理解圖像(包括圖片和視頻)的算法,,它們是許多創(chuàng)新型關(guān)鍵技術(shù)——從自動駕駛汽車到智能工業(yè)機械甚至手機上的軟件等的基礎,,也是我們正在努力構(gòu)建的能像人類自身一樣理解和學習周圍世界的機器的基礎。
到2022年底,,計算機視覺技術(shù)的市場價值預計將達到480億美元,,并可能成為許多持續(xù)創(chuàng)新和突破的來源,。美國《福布斯》雜志網(wǎng)站在近日的報道中,,列出了計算機視覺技術(shù)在2022年的五大發(fā)展和應用趨勢。
優(yōu)化數(shù)據(jù)的質(zhì)量
計算機視覺的飛速發(fā)展多虧了深度學習技術(shù)的不斷進步,。
深度學習領(lǐng)域的重要開拓者吳恩達博士開發(fā)了一些基于深度學習的圖像識別模型,,其目的是訓練計算機識別貓的圖片,這些模型尤其依賴它們被“喂食”的數(shù)據(jù)的質(zhì)量,,而不僅僅是數(shù)量,。使用自動提取并標記數(shù)據(jù)的技術(shù)提升了對標記數(shù)據(jù)的質(zhì)量,將使計算機視覺技術(shù)能用更少的數(shù)據(jù)獲得同樣的結(jié)果,,從而降低資金投入和計算資源等方面的成本,,并開辟出更多新的潛在使用案例。
應用于健康和安全領(lǐng)域
計算機視覺的一個關(guān)鍵應用是發(fā)現(xiàn)危險并在出現(xiàn)問題時發(fā)出警報,??茖W家們已經(jīng)開發(fā)出了一些方法,讓計算機能夠檢測建筑工地上的不安全行為,,比如沒有佩戴安全帽等,,以及監(jiān)控叉車等重型機械工作范圍內(nèi)的各種環(huán)境,,如果有人誤入工作范圍,它們會自動關(guān)閉,。美國勞工統(tǒng)計局的數(shù)據(jù)顯示,,每年有270萬人受工傷,越來越多企業(yè)加大了在該領(lǐng)域的投入,,以減少因疏忽造成的人力和財務成本,。
當然,防止病毒的大范圍傳播也是一個重要的應用案例,,計算機視覺技術(shù)正越來越多地被用于監(jiān)控某人是否遵守社交距離規(guī)定以及是否佩戴口罩等,。在新冠疫情肆虐期間,科學家們還開發(fā)出了計算機視覺算法,,可以通過尋找感染證據(jù)和肺部圖像受損情況,,幫助診斷患者的病情。
應用于零售業(yè)
2022年,,計算機視覺技術(shù)將會在購物和零售領(lǐng)域大力普及,。
此前,亞馬遜開創(chuàng)了無收銀員商店AmazonGo,,該雜貨店配備了攝像頭,,可以簡單識別顧客從貨架上拿走的物品。2022年預計將有更多分店開業(yè),,包括特易購在內(nèi)的其他零售商也將加入其中,,如特易購將在英國開設其首家無收銀員的超市。
除了能自動掃描商品外,,計算機視覺在零售業(yè)還有許多其他用途,,例如應用于庫存管理領(lǐng)域,攝像頭可檢查貨架上商品的擺放情況和倉庫內(nèi)的庫存情況,,并在必要時自動訂購補貨,。它還被用來監(jiān)控和了解顧客在商店內(nèi)的移動模式,以優(yōu)化商品的擺放位置,,當然,,也可以用來防止商品被盜。計算機視覺技術(shù)另一個越來越流行的使用案例是讓客戶可以用手機掃描條形碼來獲取產(chǎn)品信息,。而在時裝零售業(yè),,計算機視覺的一個特別有趣的應用是“虛擬試衣間”,顧客可以在不觸摸物品的情況下虛擬試穿物品,,甚至可以識別顧客正在試穿的產(chǎn)品,,并提供搭配建議。
在自動駕駛汽車領(lǐng)域“大顯身手”
計算機視覺已經(jīng)應用于現(xiàn)有的智能網(wǎng)聯(lián)汽車領(lǐng)域。智能網(wǎng)聯(lián)汽車指搭載先進的車載傳感器,、控制器,、執(zhí)行器等裝置,并融合現(xiàn)代通信與網(wǎng)絡技術(shù),,實現(xiàn)車與人,、路、后臺等智能信息交換共享,,實現(xiàn)安全,、舒適、節(jié)能,、高效行駛,,并最終可替代人來操作的新一代汽車。
科學家們已經(jīng)開發(fā)出一些視覺系統(tǒng),,能使用攝像頭跟蹤駕駛員的面部表情,,發(fā)出警告信號,如駕駛員可能很疲勞,,并有可能在開車時睡著等,,調(diào)查顯示,高達25%的致命和嚴重交通事故由這一因素引起,,因此,,這樣的技術(shù)和措施可以更好地挽救生命。
這項技術(shù)已經(jīng)在貨運卡車等商用車輛上使用,,到2022年,,它有望進入私家車領(lǐng)域。計算機視覺在汽車領(lǐng)域的其他可能用途包括監(jiān)控乘客是否系好安全帶,,甚至下車時是否落下鑰匙和電話等,。
當然,計算機視覺也將在自動駕駛汽車領(lǐng)域發(fā)揮重要作用,。如特斯拉公司今年宣布,,其汽車將主要依靠計算機視覺,,而不是使用雷達來為汽車行駛周圍的環(huán)境建模,。
應用于邊緣計算領(lǐng)域
邊緣計算是指在數(shù)據(jù)源頭的附近,采用開放平臺,,就近直接提供最近端的服務,。邊緣計算與云計算相反,云計算是指通過網(wǎng)絡,,把眾多數(shù)據(jù)計算處理程序分解,,通過服務器組成的系統(tǒng),把這些分解的小程序再處理分析來得到結(jié)果。
在計算機視覺領(lǐng)域,,邊緣計算技術(shù)的重要性與日俱增,,因為計算機視覺系統(tǒng)經(jīng)常需要快速作出決定,比如在自動駕駛汽車等領(lǐng)域,,因此根本沒有時間將數(shù)據(jù)發(fā)送到云,。
隨著邊緣計算的計算速度不斷提高,計算機視覺將在安全領(lǐng)域產(chǎn)生重大影響,,鑒于企業(yè)商業(yè)和個人在捕獲和使用視頻數(shù)據(jù)的方式上面臨更嚴格的審查和監(jiān)管,,這一點日益重要。