講計算機視覺之前,先和大家簡單區(qū)分一下兩個概念“機器視覺”和“計算機視覺”,這兩個技術(shù)都是通過對圖像的獲取、處理、結(jié)合人工智能算法,實現(xiàn)機器/計算機的“看到”、“看懂”之目的,都可以劃分到人工智能行業(yè)。
機器視覺通過CMOS和CCD攝取圖像,主要用于工業(yè),包括物體定位、特征檢測、缺陷判斷、目標(biāo)識別、計數(shù)和運動跟蹤。計算機視覺比機器視覺更加復(fù)雜,通過各種成像系統(tǒng)(包括視頻)獲取圖像信息,由計算機代替人腦觀察理解,做出判斷和決策。接下來,重點講解計算機視覺(ComputerVision,CV)。CV是AI細分領(lǐng)域目前最大的一個分支,2017年國內(nèi)市場規(guī)模約為15.45億元,2019年約60億元,2022年有望達到146億元(數(shù)據(jù)來源:網(wǎng)絡(luò)資料整理)。在CV領(lǐng)域,我國無論在市場空間,還是在技術(shù)上都處于領(lǐng)先地位。目前CV應(yīng)用最大的領(lǐng)域是安防,其次是金融和手機,也正在逐漸滲透到娛樂、家居、交通(包括自動駕駛)、醫(yī)療等領(lǐng)域。計算機視覺行業(yè)根據(jù)技術(shù)層級從上到下,分為基礎(chǔ)層、技術(shù)層和應(yīng)用層?;A(chǔ)層最靠近“云”,應(yīng)用層最靠近“端”。借用下圖吧。注:圖片來源網(wǎng)絡(luò),侵刪CV界(算法)四大獨角獸分別是曠視科技、依圖科技、商湯科技、云從科技,這四家公司分別成立于2012/2013/2014/2015年。女孩子們最熟悉的美圖秀秀技術(shù)就來源于曠視科技。在安防領(lǐng)域落地項目較多的是云從和依圖,都分別和20-30個省份的城市有合作。在手機領(lǐng)域,商湯和曠世的落地項目更多,都和oppo、vivo、小米等手機品牌有合作。從技術(shù)流程上看,CV識別分為六個過程:圖像獲取、預(yù)處理、圖片分割、特征提取、機器判別、建模、應(yīng)用。注:圖片來源網(wǎng)絡(luò),侵刪第一步鏡頭獲取圖像后的一系列的動作都是由計算機完成,其中數(shù)據(jù)量、運算力和算法模型是決定CV最終輸出結(jié)果速度、準(zhǔn)確率等的關(guān)鍵因素;這三者也是各CV公司之間競爭的核心。之后會發(fā)文分享CV細節(jié)。