計算機(jī)視覺(也被稱為機(jī)器視覺)是人工智能技術(shù)最令人興奮的應(yīng)用之一。該技術(shù)旨在“教”會計算機(jī)如何“看”世界,,它與自然語言處理及語音識別并列為機(jī)器學(xué)習(xí)領(lǐng)域的三大熱點方向,。■ 視覺中國供圖
計算機(jī)視覺技術(shù)囊括很多能夠理解圖像(包括圖片和視頻)的算法,,它們是許多創(chuàng)新型關(guān)鍵技術(shù)——從自動駕駛汽車到智能工業(yè)機(jī)械甚至手機(jī)上的軟件等的基礎(chǔ),,也是我們正在努力構(gòu)建的能像人類自身一樣理解和學(xué)習(xí)周圍世界的機(jī)器的基礎(chǔ)。
到2022年底,,計算機(jī)視覺技術(shù)的市場價值預(yù)計將達(dá)到480億美元,,并可能成為許多持續(xù)創(chuàng)新和突破的來源。美國《福布斯》雜志網(wǎng)站在近日的報道中,,列出了計算機(jī)視覺技術(shù)在2022年的五大發(fā)展和應(yīng)用趨勢,。
優(yōu)化數(shù)據(jù)的質(zhì)量
計算機(jī)視覺的飛速發(fā)展多虧了深度學(xué)習(xí)技術(shù)的不斷進(jìn)步。
深度學(xué)習(xí)領(lǐng)域的重要開拓者吳恩達(dá)博士開發(fā)了一些基于深度學(xué)習(xí)的圖像識別模型,,其目的是訓(xùn)練計算機(jī)識別貓的圖片,,這些模型尤其依賴它們被“喂食”的數(shù)據(jù)的質(zhì)量,而不僅僅是數(shù)量,。使用自動提取并標(biāo)記數(shù)據(jù)的技術(shù)提升了對標(biāo)記數(shù)據(jù)的質(zhì)量,,將使計算機(jī)視覺技術(shù)能用更少的數(shù)據(jù)獲得同樣的結(jié)果,從而降低資金投入和計算資源等方面的成本,并開辟出更多新的潛在使用案例,。
應(yīng)用于健康和安全領(lǐng)域
計算機(jī)視覺的一個關(guān)鍵應(yīng)用是發(fā)現(xiàn)危險并在出現(xiàn)問題時發(fā)出警報,。科學(xué)家們已經(jīng)開發(fā)出了一些方法,,讓計算機(jī)能夠檢測建筑工地上的不安全行為,,比如沒有佩戴安全帽等,以及監(jiān)控叉車等重型機(jī)械工作范圍內(nèi)的各種環(huán)境,,如果有人誤入工作范圍,,它們會自動關(guān)閉。美國勞工統(tǒng)計局的數(shù)據(jù)顯示,,每年有270萬人受工傷,,越來越多企業(yè)加大了在該領(lǐng)域的投入,以減少因疏忽造成的人力和財務(wù)成本,。
當(dāng)然,,防止病毒的大范圍傳播也是一個重要的應(yīng)用案例,計算機(jī)視覺技術(shù)正越來越多地被用于監(jiān)控某人是否遵守社交距離規(guī)定以及是否佩戴口罩等,。在新冠疫情肆虐期間,,科學(xué)家們還開發(fā)出了計算機(jī)視覺算法,可以通過尋找感染證據(jù)和肺部圖像受損情況,,幫助診斷患者的病情,。
應(yīng)用于零售業(yè)
2022年,計算機(jī)視覺技術(shù)將會在購物和零售領(lǐng)域大力普及,。
此前,,亞馬遜開創(chuàng)了無收銀員商店AmazonGo,該雜貨店配備了攝像頭,,可以簡單識別顧客從貨架上拿走的物品,。2022年預(yù)計將有更多分店開業(yè),包括特易購在內(nèi)的其他零售商也將加入其中,,如特易購將在英國開設(shè)其首家無收銀員的超市,。
除了能自動掃描商品外,計算機(jī)視覺在零售業(yè)還有許多其他用途,,例如應(yīng)用于庫存管理領(lǐng)域,,攝像頭可檢查貨架上商品的擺放情況和倉庫內(nèi)的庫存情況,并在必要時自動訂購補貨,。它還被用來監(jiān)控和了解顧客在商店內(nèi)的移動模式,,以優(yōu)化商品的擺放位置,當(dāng)然,,也可以用來防止商品被盜,。計算機(jī)視覺技術(shù)另一個越來越流行的使用案例是讓客戶可以用手機(jī)掃描條形碼來獲取產(chǎn)品信息,。而在時裝零售業(yè),計算機(jī)視覺的一個特別有趣的應(yīng)用是“虛擬試衣間”,,顧客可以在不觸摸物品的情況下虛擬試穿物品,,甚至可以識別顧客正在試穿的產(chǎn)品,并提供搭配建議,。
在自動駕駛汽車領(lǐng)域“大顯身手”
計算機(jī)視覺已經(jīng)應(yīng)用于現(xiàn)有的智能網(wǎng)聯(lián)汽車領(lǐng)域,。智能網(wǎng)聯(lián)汽車指搭載先進(jìn)的車載傳感器、控制器,、執(zhí)行器等裝置,,并融合現(xiàn)代通信與網(wǎng)絡(luò)技術(shù),實現(xiàn)車與人,、路,、后臺等智能信息交換共享,實現(xiàn)安全,、舒適,、節(jié)能、高效行駛,,并最終可替代人來操作的新一代汽車,。
科學(xué)家們已經(jīng)開發(fā)出一些視覺系統(tǒng),能使用攝像頭跟蹤駕駛員的面部表情,,發(fā)出警告信號,,如駕駛員可能很疲勞,并有可能在開車時睡著等,,調(diào)查顯示,,高達(dá)25%的致命和嚴(yán)重交通事故由這一因素引起,因此,,這樣的技術(shù)和措施可以更好地挽救生命,。
這項技術(shù)已經(jīng)在貨運卡車等商用車輛上使用,,到2022年,,它有望進(jìn)入私家車領(lǐng)域。計算機(jī)視覺在汽車領(lǐng)域的其他可能用途包括監(jiān)控乘客是否系好安全帶,,甚至下車時是否落下鑰匙和電話等,。
當(dāng)然,計算機(jī)視覺也將在自動駕駛汽車領(lǐng)域發(fā)揮重要作用,。如特斯拉公司今年宣布,,其汽車將主要依靠計算機(jī)視覺,而不是使用雷達(dá)來為汽車行駛周圍的環(huán)境建模,。
應(yīng)用于邊緣計算領(lǐng)域
邊緣計算是指在數(shù)據(jù)源頭的附近,,采用開放平臺,,就近直接提供最近端的服務(wù)。邊緣計算與云計算相反,,云計算是指通過網(wǎng)絡(luò),,把眾多數(shù)據(jù)計算處理程序分解,通過服務(wù)器組成的系統(tǒng),,把這些分解的小程序再處理分析來得到結(jié)果,。
在計算機(jī)視覺領(lǐng)域,邊緣計算技術(shù)的重要性與日俱增,,因為計算機(jī)視覺系統(tǒng)經(jīng)常需要快速作出決定,,比如在自動駕駛汽車等領(lǐng)域,因此根本沒有時間將數(shù)據(jù)發(fā)送到云,。
隨著邊緣計算的計算速度不斷提高,,計算機(jī)視覺將在安全領(lǐng)域產(chǎn)生重大影響,鑒于企業(yè)商業(yè)和個人在捕獲和使用視頻數(shù)據(jù)的方式上面臨更嚴(yán)格的審查和監(jiān)管,,這一點日益重要,。