計算機視覺(computer vision)是一門研究如何使機器“看”的科學(xué),進一步說就是指用攝影機和計算機代替人眼對目標(biāo)進行識別、跟蹤和測量等機器視覺,并進一步做圖像處理,用計算機處理成為更適合人眼觀察或傳送給儀器檢測的圖像。
作為一門科學(xué)學(xué)科,計算機視覺研究相關(guān)的理論和技術(shù),試圖創(chuàng)建能夠從圖像或者多維數(shù)據(jù)中獲取“信息”的人工智能系統(tǒng)。這里所指的信息定義的,可以用來幫助做一個“決定”的信息。材料補充:計算機視覺的方向可以分為基于深度學(xué)習(xí)的和基于幾何方法的。
1、基于深度學(xué)習(xí)的:文字識別、圖像識別、人臉識別、視頻內(nèi)容理解、醫(yī)療影像診斷、神經(jīng)網(wǎng)絡(luò)芯片、駕駛輔助等。
2、基于幾何方法的:虛擬現(xiàn)實、增強現(xiàn)實、三維重建、機器人、無人機、無人駕駛等。作為一個工程學(xué)科,計算機視覺尋求基于相關(guān)理論與模型來創(chuàng)建計算機視覺系統(tǒng)。這類系統(tǒng)的組成部分主要包括:
1、過程控制(例如工業(yè)機器人和無人駕駛汽車)。
2、事件監(jiān)測(例如圖像監(jiān)測)。
3、信息組織(例如圖像數(shù)據(jù)庫和圖像序列的索引創(chuàng)建)。
4、物體與環(huán)境建模(例如工業(yè)檢查,醫(yī)學(xué)圖像分析和拓撲建模)。
5、交感互動(例如人機互動的輸入設(shè)備)。