根據(jù)美國自動(dòng)成像協(xié)會(AIA)的定義,機(jī)器視覺(Machine Vision)是一種基于捕獲并處理的圖像為執(zhí)行設(shè)備提供操作指導(dǎo)的硬件和軟件的組合。
如下圖,典型的機(jī)器視覺系統(tǒng)分為成像和圖像處理分析兩大部分。成像部分包括光源及光源控制器、鏡頭、相機(jī)等硬件部分,負(fù)責(zé)輸出符合系統(tǒng)要求的圖像。視覺控制系統(tǒng)負(fù)責(zé)對成像結(jié)果進(jìn)行處理分析并根據(jù)分析結(jié)果控制PLC等執(zhí)行設(shè)備執(zhí)行對應(yīng)操作。
機(jī)器視覺系統(tǒng)的構(gòu)成
圖源:Vital Vision
機(jī)器視覺主要功能按照難度遞增可分為識別、測量、定位及檢測,通過機(jī)器代替人工進(jìn)行測量與判斷,將圖像處理應(yīng)用于工業(yè)自動(dòng)化領(lǐng)域中。 識別:基于目標(biāo)物體的物理特征,如外形、顏色、數(shù)字、條碼、人臉等進(jìn)行甄別。 測量:將獲取的圖像像素信息標(biāo)定成常用度量衡單位,再在圖像中精確計(jì)算目標(biāo)物的幾何尺寸。 定位:基于圖像標(biāo)定、目標(biāo)檢測、尺寸查找等算法,獲得目標(biāo)物關(guān)于二維或三維的位置信息,然后引導(dǎo)機(jī)器人進(jìn)行定位或者組裝。 檢測:難度最高,主要指外觀檢測,對產(chǎn)品裝備后的完整性檢測、外觀缺陷檢測等。
機(jī)器視覺3D外觀檢測
圖源:iqsdirectory
機(jī)器視覺產(chǎn)業(yè)鏈從上游到下游分為三大類。
核心零部件供應(yīng)商:上游零部件主要包括光源、鏡頭、2D/3D相機(jī)、傳感器、圖像采集卡等。關(guān)鍵零部件和軟件系統(tǒng)約占工業(yè)機(jī)器視覺產(chǎn)品總成本的80%。
AI相機(jī)和圖像采集卡
圖源:adlink
機(jī)器視覺上游零部件成本占比較高,是機(jī)器視覺的核心部分。其中光源、工業(yè)相機(jī)、底層軟件算法等技術(shù)壁壘及利潤率水平較高,因此對機(jī)器視覺上游環(huán)節(jié)的掌握是目前市場競爭的關(guān)鍵。 軟件及AI服務(wù)商:以集成通用算法軟件開發(fā)包和 AI 加速平臺服務(wù)商為主,幾乎來自海外龍頭公司。在機(jī)器視覺中,軟件算法主要作用包括:圖像預(yù)處理、特征提取、物體檢測與識別,以及場景解析等,相關(guān)應(yīng)用需要同時(shí)基于傳統(tǒng)的計(jì)算機(jī)視覺技術(shù),以及以深度學(xué)習(xí)為代表的AI相關(guān)技術(shù)。 物體檢測與識別、特征提取 圖源:3hle.ch 伴隨AI技術(shù)發(fā)展,軟件算法亦在持續(xù)不斷升級更新,推進(jìn)在機(jī)器視覺從過去傳統(tǒng)標(biāo)準(zhǔn)化檢測場景過渡到非標(biāo)定制化場景。 視覺系統(tǒng)及解決方案集成商:方案集成商以工業(yè)自動(dòng)化非標(biāo)設(shè)備及方案為主。在視覺檢測系統(tǒng)中,工件位置的一致性,打光的穩(wěn)定性,物體的運(yùn)動(dòng)速度,高精度測量的標(biāo)定,軟件的測量精度都會對系統(tǒng)產(chǎn)生影響。
在線視覺檢測系統(tǒng)
圖源:Cielotech
對于工業(yè)現(xiàn)場或者生產(chǎn)線,將視覺系統(tǒng)嵌入到生產(chǎn)線的相應(yīng)工序中,適配產(chǎn)線的生產(chǎn)速度是方案集成的關(guān)鍵難點(diǎn)。
機(jī)器視覺已廣泛應(yīng)用于消費(fèi)電子、汽車制造、半導(dǎo)體、光伏等標(biāo)準(zhǔn)化領(lǐng)域。在標(biāo)準(zhǔn)化的工業(yè)環(huán)境中,機(jī)器視覺主要運(yùn)用于產(chǎn)品質(zhì)量檢測、裝配檢測和包裝檢測等環(huán)節(jié)。這些環(huán)節(jié)的檢測任務(wù)具有高度的規(guī)律性和標(biāo)準(zhǔn)化,因此,常常采用模式匹配、特征識別等技術(shù),根據(jù)預(yù)設(shè)的規(guī)則進(jìn)行決策。
機(jī)器視覺領(lǐng)域在AI加持下迎來底層技術(shù)突破,Meta發(fā)布的首個(gè)圖像分割基礎(chǔ)模型SAM(Segment Anything Model,分割一切),其底層以NLP模型的通用方式解決圖像分割和識別問題。
SAM2模型進(jìn)行圖像分割的過程
圖源:Learn OpenCV
分割技術(shù)是圖像處理的底層技術(shù),用于查找和分割圖像中的任何對象,該可應(yīng)用于各種領(lǐng)域。圖像處理的各種通用模型,極大地降低了圖像處理的門檻,是機(jī)器視覺領(lǐng)域的底層突破性技術(shù)。 在AI加持下,機(jī)器視覺迎來了底層技術(shù)的突破。從算法、技術(shù)到應(yīng)用,AI技術(shù)極大程度賦能機(jī)器視覺在圖像模型上的智能化應(yīng)用,優(yōu)化了圖像識別的復(fù)雜度及精度。從而推動(dòng)機(jī)器視覺在缺陷檢測、醫(yī)療影像、衛(wèi)星遙感等非標(biāo)準(zhǔn)化場景的應(yīng)用。
AI+機(jī)器視覺,應(yīng)用場景持續(xù)拓展-中泰證券