更新時(shí)間:2022-04-07 來(lái)源:黑馬程序員 瀏覽量:
計(jì)算機(jī)視覺(jué)是指用攝像機(jī)和電腦及其他相關(guān)設(shè)備,對(duì)生物視覺(jué)的一種模擬。它的主要任務(wù)是讓計(jì)算機(jī)理解圖片或者視頻中的內(nèi)容,就像人類(lèi)和許多其他生物每天所做的那樣。
我們可以將其任務(wù)目標(biāo)拆分為:
讓計(jì)算機(jī)理解圖片中的場(chǎng)景(辦公室,客廳,咖啡廳等)
讓計(jì)算機(jī)識(shí)別場(chǎng)景中包含的物體(寵物,交通工具,人等)
讓計(jì)算機(jī)定位物體在圖像中的位置(物體的大小,邊界等)
讓計(jì)算機(jī)理解物體之間的關(guān)系或行為(是在對(duì)話(huà),比賽或吵架等),以及圖像表達(dá)的意義(喜慶的,悲傷的等)
那我們?cè)贠penCV階段,主要學(xué)習(xí)圖像處理,而圖像處理主要目的是對(duì)圖像的處理,比如平滑,縮放等,想、從而為其他任務(wù)(比如“計(jì)算機(jī)視覺(jué)”)做好前期工作。
根據(jù)對(duì)計(jì)算機(jī)視覺(jué)目標(biāo)任務(wù)的分解,可將其分為三大經(jīng)典任務(wù):圖像分類(lèi)、目標(biāo)檢測(cè)、圖像分割。
圖像分類(lèi)(Classification):即是將圖像結(jié)構(gòu)化為某一類(lèi)別的信息,用事先確定好的類(lèi)別(category)來(lái)描述圖片。
目標(biāo)檢測(cè)(Detection):分類(lèi)任務(wù)關(guān)心整體,給出的是整張圖片的內(nèi)容描述,而檢測(cè)則關(guān)注特定的物體目標(biāo),要求同時(shí)獲得這一目標(biāo)的類(lèi)別信息和位置信息(classification + localization)。
圖像分割(Segmentation):分割是對(duì)圖像的像素級(jí)描述,它賦予每個(gè)像素類(lèi)別(實(shí)例)意義,適用于理解要求較高的場(chǎng)景,如無(wú)人駕駛中對(duì)道路和非道路的分割。
接下來(lái)的課程中我們將圍繞這三個(gè)任務(wù)對(duì)計(jì)算機(jī)視覺(jué)進(jìn)行介紹。
計(jì)算機(jī)視覺(jué)涉及的領(lǐng)域復(fù)雜,具有廣泛的實(shí)際應(yīng)用范圍??傮w而言,依賴(lài)于人工智能和機(jī)器學(xué)習(xí),尤其是計(jì)算機(jī)視覺(jué)的創(chuàng)新的好處是,從電子商務(wù)行業(yè)到更經(jīng)典的各種類(lèi)型和規(guī)模的公司都可以利用其強(qiáng)大的功能,下圖展示了相關(guān)的應(yīng)用場(chǎng)景及相關(guān)的企業(yè):
人臉識(shí)別技術(shù)目前已經(jīng)廣泛應(yīng)用于金融、司法、軍隊(duì)、公安、邊檢、政府、航天、電力、工廠(chǎng)、教育、醫(yī)療等行業(yè)。據(jù)業(yè)內(nèi)人士分析,我國(guó)的人臉識(shí)別產(chǎn)業(yè)的需求旺盛,需求推動(dòng)導(dǎo)致企業(yè)敢于投入資金。
代表企業(yè):Face++曠視科技、依圖科技、商湯科技、深醒科技、云從科技等。
人工智能技術(shù)可以對(duì)結(jié)構(gòu)化的人、車(chē)、物等視頻內(nèi)容信息進(jìn)行快速檢索、查詢(xún)。這項(xiàng)應(yīng)用使得讓公安系統(tǒng)在繁雜的監(jiān)控視頻中搜尋到罪犯的有了可能。在大量人群流動(dòng)的交通樞紐,該技術(shù)也被廣泛用于人群分析、防控預(yù)警等。
代表企業(yè):SenseTime 商湯科技、DeepGlint 格靈深瞳、依圖科技、云天勵(lì)飛、深網(wǎng)視界等。
代表企業(yè):Face++曠視科技、圖普科技、碼隆科技、酒咔嚓、YI+陌上花科技等。
隨著汽車(chē)的普及,汽車(chē)已經(jīng)成為人工智能技術(shù)非常大的應(yīng)用投放方向,但就目前來(lái)說(shuō),想要完全實(shí)現(xiàn)自動(dòng)駕駛/無(wú)人駕駛,距離技術(shù)成熟還有一段路要走。不過(guò)利用人工智能技術(shù),汽車(chē)的駕駛輔助的功能及應(yīng)用越來(lái)越多,這些應(yīng)用多半是基于計(jì)算機(jī)視覺(jué)和圖像處理技術(shù)來(lái)實(shí)現(xiàn)。
代表企業(yè):縱目科技、TuSimple 圖森科技、馭勢(shì)科技、MINIEYE 佑駕創(chuàng)新、中天安馳等。
除了上述這些,計(jì)算機(jī)視覺(jué)在三維視覺(jué),三維重建,工業(yè)仿真,地理信息系統(tǒng),工業(yè)視覺(jué),醫(yī)療影像診斷,文字識(shí)別(OCR),圖像及視頻編輯等領(lǐng)域也有廣泛的應(yīng)用。