文|數(shù)智前線 徐鑫
編輯|周路平
過去幾十年里,工業(yè)質(zhì)檢領域是傳統(tǒng)機器視覺廠商的主場,典型代表有基恩士和康耐視等國際巨頭和老牌機器視覺廠商,他們用標準化的軟硬件產(chǎn)品占據(jù)了大部分工業(yè)質(zhì)檢市場。
不過,在一些光學成像環(huán)境相對復雜,以及瑕疵類型很難被明確定義的場景,或者目前的機器視覺設備無法達到檢測要求的混檢場景,依然依賴人工。而隨著深度學習技術進步,不少企業(yè)選擇通過AI 算法的視覺檢測技方案進入這一市場。
但問題也非常明顯。在很多場景里,AI算法的定制色彩濃厚,對瑕疵的識別能力很難從一個場景遷移到其他類似場景。同時,工業(yè)制造中質(zhì)量要求高,罕見的瑕疵數(shù)據(jù)很難收集,負樣本不足,使得算法的識別能力有待加強。
大模型到來后,這些痛點有望得到解決。市場分析機構(gòu)IDC中國高級分析師楊雯告訴數(shù)智前線,目前,AI質(zhì)檢與大模型的結(jié)合在業(yè)界已經(jīng)有了一些探索和落地。相比原有的小模型方案,大模型對瑕疵識別的泛化能力更高,一個場景訓練的模型可以遷移到類似場景而不需要更多算法調(diào)整,同時還能更好應用多模態(tài)數(shù)據(jù),提取特征,提升質(zhì)檢的準確性。
在大模型真正解決這些行業(yè)瓶頸前,競爭仍在持續(xù)。老牌的機器視覺標準化方案商力圖增加軟件方面的能力,而此前長于算法的團隊則在加強產(chǎn)品的標準化能力,軟硬件一體交付。有資深人士認為,在逐漸相融的戰(zhàn)場里,一些僅憑算法想切入場景的公司會越來越艱難。
01、非標場景正在被攻破
蘇州常熟的一家印刷電路板工廠的終檢車間,工人們頂著工作臺上的LED光,在電腦屏幕前,細致地復檢一塊又一塊指甲蓋大小的電路板。
這些電路板剛剛通過一臺外觀檢測機的檢測,被設備判定為了“瑕疵品”。外觀檢測機在電子元件和半導體行業(yè)里非常常見,原本需要人工在顯微鏡上完成的作業(yè),有了它之后,可由一套機器視覺設備自動處理。它包含了光源、工業(yè)相機和機器視覺軟件等一套完整的軟硬件解決方案,作業(yè)時需要在軟件上定義瑕疵的類型,例如設置色差和灰階值等,判定出瑕疵。
但這種設備也有短板,為了確保良率,經(jīng)常會出現(xiàn)“誤殺”的情況,行業(yè)內(nèi)稱為“假點”。工人們之所以需要在電腦屏幕上進行復檢,就是把被“誤殺”的良品挑出來。這也是傳統(tǒng)的機器視覺解決方案在工業(yè)現(xiàn)場經(jīng)常碰到的情況。自動化設備可以降低質(zhì)檢的人力成本,但如果準確率達不到要求時,還需要人工去完成假點復核,才能確保質(zhì)檢的準確性。
AI質(zhì)檢解決方案就在這種時刻登場。在上述工廠里,百度智能云的AI質(zhì)檢解決方案,可以用AI算法去學習假點的特性,原有的外觀檢測機發(fā)現(xiàn)假點后,用人工智能的算法學習假點的特點,自動去除絕大多數(shù)假點,就能免去人工復核時大量的不必要工作。
焊點和點膠等也是傳統(tǒng)機器視覺解決方案很難有很好檢測效果的場景。AI質(zhì)檢解決方案商偲倢科技的AI技術總監(jiān)黃靖瑋告訴數(shù)智前線,傳統(tǒng)的機器視覺方案,需要寫一些規(guī)則來定義需要檢測的場景。它能處理一些容易定義的特征,如顏色、面積、規(guī)則的形狀和距離等指標。但焊點這個場景,由人去定義規(guī)則其實很困難。比如焊點的大小和顏色的情況等,在定義規(guī)則時會變得很復雜,人的肉眼去判斷則更為直觀。通常情況下這類場景都是人肉眼識別完成。
偲倢科技是一家總部在臺北的工業(yè)AI創(chuàng)業(yè)公司,目前他們的質(zhì)檢整體解決方案已經(jīng)應用在半導體、連接器等多個高附加值行業(yè)?!翱蛻粲型袋c,但是傳統(tǒng)的視覺方案不好做的場景,也是客戶對我們有需求的地方?!秉S靖瑋介紹,例如產(chǎn)線可能有10種瑕疵,原來的視覺檢測的方案可檢查出7種,針對后面沒有辦法檢測的3種,客戶可能會用AI方案去做。
質(zhì)量檢測是工業(yè)大生產(chǎn)的重要一環(huán)。在全球,利用機器視覺來檢查產(chǎn)品的外觀,提升產(chǎn)品的一致性,保證質(zhì)量穩(wěn)定,催生了繁榮的機器視覺質(zhì)檢市場,行業(yè)里還出現(xiàn)了基恩士這樣的年營收超過六十億美金,市值超過1000億美元的機器視覺龍頭。GGII數(shù)據(jù)顯示,2021年全球機器視覺市場規(guī)模約為804億元,同比2020年增長12.15%,預計至2025年該市場規(guī)模將超過1200億元。
近年來隨著深度學習技術進步,基于深度學習等 AI 算法的視覺檢測技術,被用于工業(yè)生產(chǎn),對產(chǎn)品圖像進行視覺檢測,幫助發(fā)現(xiàn)和消除缺陷,相關的解決方案商也已嶄露頭角。百度、騰訊、阿里、華為等多家云廠商以及創(chuàng)新奇智等一批創(chuàng)新企業(yè)都在這一賽道布局。
IDC統(tǒng)計,2022 年工業(yè)質(zhì)檢解決方案(不包含硬件) 整體市場規(guī)模為 2.7 億美元,較 2021 年增長了 27.4%,增長趨勢有所放緩,但對比其他 AI市場仍然屬于相對較高的水平。業(yè)界人士認為,作為新興賽道,這一領域處于初期發(fā)展階段,但增長勢頭迅猛。
02、復雜工業(yè)場景遇到落地瓶頸
資深人士指出,附加值高的行業(yè)正率先應用和探索AI質(zhì)檢方案。IDC介紹,目前AI質(zhì)檢解決方案在通信和電子制造、汽車及零部件、消費品和原材料等行業(yè)里的需求相對旺盛,是目前市場的主要應用行業(yè)。其中3C和汽車(包括鋰電池制造)行業(yè)成熟的應用場景較多,應用的范圍也比較廣。2022年,AI 質(zhì)檢有不少新行業(yè)和新應用場景出現(xiàn),例如裝備制造、包裝印刷、食品飲料等。
也有不少企業(yè)在探索紡織行業(yè)應用AI質(zhì)檢方案。但這個市場有特殊性。一方面,市場規(guī)模龐大,但此前的行業(yè)標準化程度及信息化建設水平相對較低,傳統(tǒng)的機器視覺質(zhì)檢方案落地難度大。近年來,行業(yè)里一些企業(yè)的自動化流程提升,加上成熟工人招工變困難,而業(yè)務場景里切實存在痛點,人工檢測方案容易漏檢影響質(zhì)量。另外一些新的趨勢如小單快反等市場需求也倒逼行業(yè)的生產(chǎn)效率提速,這使得不少服裝企業(yè)重視AI的解決方案在質(zhì)檢環(huán)節(jié)應用。
不過,AI算法要解決復雜工業(yè)場景里的問題,客觀上需要跨越多重挑戰(zhàn)。
兩年前,在將企業(yè)的AI質(zhì)檢解決方案AINavi落地到一些半導體、連接器等行業(yè)時,黃靖瑋和他的同事們?yōu)殍Υ脭?shù)據(jù)不足感到困擾。實際上這也是行業(yè)里普遍面臨的問題。要訓練AI算法需要不少的負樣本數(shù)據(jù),但是由于工業(yè)生產(chǎn)對質(zhì)量要求嚴苛,通常良率很高,一個半導體元件的某類瑕疵,半年可能也很難遇見一次。
同時,工廠環(huán)境里的瑕疵樣本需要嚴格遵守客戶的保密要求,除非經(jīng)過允許,一般很難被解決方案商拿出客戶環(huán)境做訓練,這客觀上也限制了AI算法的性能提升。一位資深人士還告訴數(shù)智前線,目前工業(yè)質(zhì)檢相關的公開數(shù)據(jù)集非常缺乏。例如他們關注的某一類半導體相關的公開數(shù)據(jù)圖片只有幾百張,這大大影響了訓練出來的算法模型的智能程度。
除了數(shù)據(jù)缺乏,工業(yè)現(xiàn)場的各種變化也考驗AI算法的落地能力。例如,企業(yè)最初應用AI算法時,希望能解決某個場景里的所有瑕疵。但隨著應用落地后,企業(yè)經(jīng)營狀況可能發(fā)生了變化。比如出現(xiàn)產(chǎn)量不足問題時,企業(yè)就想要增加產(chǎn)量。這時如果某一類瑕疵對品質(zhì)沒有太多的影響,企業(yè)可能希望放過不檢。
上述資深人士介紹,要讓AI模型知道,某一類瑕疵不檢測,一般要重新訓練模型,讓它適應新的場景。算法無法適應業(yè)務需要,這也是許多企業(yè)應用AI質(zhì)檢方案有疑慮的地方?!跋啾榷裕瑐鹘y(tǒng)的工業(yè)視覺解決方案可能只需要調(diào)整幾個參數(shù)就能繼續(xù)服務,但AI質(zhì)檢解決方案可能需要重新訓練模型”,該人士說。
另外,產(chǎn)品本身可能也在更新。比如產(chǎn)品增加了新的型號,涉及到不同的材料、顏色或者形狀,這時可能也需要重新去訓練算法來適應新場景。一位制造業(yè)智能化的資深人士評價,“做單一場景的算法很容易出現(xiàn)ROI算不過來的情況?!币虼嗽S多潛在應用方非常關注AI質(zhì)檢解決方案上線后,未來企業(yè)自己能否自主調(diào)整或擴充算法,使其更具適應性。
IDC楊雯也告訴數(shù)智前線,AI質(zhì)檢領域發(fā)展到現(xiàn)在,主要的瓶頸有,數(shù)據(jù)的質(zhì)量和數(shù)量不足,難以訓練出高性能的模型;以及場景的碎片化,算法模型的泛化能力和魯棒性不能適應各種復雜的應用場景,新場景算法開發(fā)成本偏高等。目前,行業(yè)是否能落地應用AI質(zhì)檢技術,主要取決于場景的技術難度和投入產(chǎn)出比。
03、平臺是沉淀標準的關鍵
為了解決場景的碎片化難題,提升算法的泛化能力和魯棒性,行業(yè)也有一些新的思路。
一位業(yè)界資深人士告訴數(shù)智前線,針對同一個產(chǎn)線里的算法適應性問題,有些廠商會開發(fā)一些工具,并在算法上線前就與應用企業(yè)充分討論瑕疵的定義和未來調(diào)整與變動可能性。未來場景變動,需要重新訓練算法時,企業(yè)能自己上手并快速調(diào)整。
AI質(zhì)檢服務商還把AI質(zhì)檢解決方案落地抽象成固化的流程,并用軟件和工具去簡化過程,從而加速其在不同企業(yè)的落地。例如,偲倢科技把AI算法落地到產(chǎn)線上固化為幾步:瑕疵定義(使其符合實際產(chǎn)線上的規(guī)范)、標注方式(并與標注員同步)、模型訓練和驗證,最后要上產(chǎn)線去調(diào)整模型。黃靖瑋介紹,他們做了軟件工具,雖然算法每落地一個企業(yè)都要走這個流程,但有了規(guī)范,在軟件工具的幫助下,過程會更為順利。
一些新趨勢也在出現(xiàn)。隨著企業(yè)內(nèi)部智能化應用場景逐步增加,企業(yè)應用AI的程度深入,大型企業(yè)里存在大量的智能化視覺設備,里面有各類算法,不管是標準的還是定制的,這些算法都需要針對場景變化做一些迭代和復用。
比如,企業(yè)跟高校合作開發(fā)某個場景的視覺智能算法,算法的后期運維需要企業(yè)來做,這是個令人頭疼的問題。阿里云的資深制造業(yè)解決方案專家華超杰認為,“這里面就出現(xiàn)了類似于整體的視覺算法平臺化能力的機會。”阿里云把工業(yè)場景里與質(zhì)量有關的場景需求和能力抽象成了質(zhì)量智能管理解決方案(AIQS),這個開放性平臺提供了質(zhì)量分析的完整工具鏈,滿足企業(yè)從全局出發(fā)管理視覺能力的需求。
目前主流大廠的產(chǎn)品或解決方案都非常重視從平臺層面建設與AI質(zhì)檢相關的能力,沉淀相對標準化的解決方案,一方面解決復制性問題,另外也能滿足企業(yè)更系統(tǒng)建設智能化能力的需求。
例如,百度智能云在工業(yè)質(zhì)檢領域的能力沉淀到了“開物”旗下的工業(yè)視覺智能平臺上,其中封裝了從底層算法、算子到上層的行業(yè)性模型等多層能力,并能夠提供完備的端到端解決方案。相關工程師此前接受數(shù)智前線采訪時表示,一個新的案例出現(xiàn),如果在有成熟模型的行業(yè),就可以基于初始模型,快速去做模型訓練和迭代。如果是全新的場景,也可以基于AI框架和結(jié)構(gòu),從算法、算式和整個模型層快速作零代碼開發(fā)。
騰訊云在AI質(zhì)檢領域則形成了TI平臺、工業(yè)質(zhì)檢訓練平臺等AI視覺檢測產(chǎn)品矩陣,覆蓋工業(yè)質(zhì)檢全流程。以騰訊云TI平臺為例,它能幫助研發(fā)人員提高AI應用開發(fā)、調(diào)試效率。在一站式的平臺上打通標注、建模、調(diào)優(yōu)、封裝、服務發(fā)布全流程,輔助客戶做數(shù)據(jù)可視化與統(tǒng)一納管,提供可視化與低碼建模工具,降低AI建模與調(diào)試的門檻。
除了AI的視覺檢測技術布局,一些廠商還重視基于設備數(shù)據(jù)的數(shù)據(jù)智能能力,用于一些無法通過視覺觀察表面判定質(zhì)量水平的場景。以阿里云的AIQS為例,他們除了AI視覺質(zhì)檢產(chǎn)品,也在重點打造質(zhì)檢等數(shù)據(jù)智能解決方案。在流程制造領域,利用設備每秒產(chǎn)生的數(shù)據(jù)用于監(jiān)控質(zhì)量問題。比如,焊接過程中,把兩個金屬件焊接在一起時,采集設備產(chǎn)生的連續(xù)數(shù)據(jù),通過算法去分析,可以判定質(zhì)量是否有異常,也可以提前去做質(zhì)量的預測,并做相關工藝的干預和推薦。
04、大模型帶來的行業(yè)思考
大模型的風刮到了AI質(zhì)檢領域。無論是視覺類AI檢測方案,還是數(shù)據(jù)智能類產(chǎn)品,都有利用大模型升級的潛力。
IDC分析師楊雯指出,在視覺類場景里,大模型的優(yōu)越性主要體現(xiàn)在對瑕疵識別的泛化能力更高。大模型由于具有更多的參數(shù)和更大的容量,能夠更好地遷移到其他場景。同時,它可以通過更深層次的神經(jīng)網(wǎng)絡和更復雜的算法,更好地提取圖像和數(shù)據(jù)的特征,從而更準確地識別瑕疵和異常。
另外,大模型還可以更好地利用自監(jiān)督學習方法,從大量的無標注數(shù)據(jù)中學習到復雜表征,進一步提高模型的魯棒性。這種自監(jiān)督學習能力對于解決工業(yè)AI質(zhì)檢中的數(shù)據(jù)標注困難和數(shù)據(jù)稀缺問題具有重要意義。
百度智能云工業(yè)互聯(lián)網(wǎng)解決方案首席架構(gòu)師楊文旭則介紹,除了用大模型解決數(shù)據(jù)不足的問題,基于大模型的遷移學習技術,企業(yè)還可以利用自己的小數(shù)據(jù)集進行微調(diào),從而使其模型更具針對性。
同時他認為,大模型結(jié)合跨模態(tài)技術,將進一步擴大AI模型的應用范圍。AI質(zhì)檢大模型具備對缺陷影像的解讀能力,用戶不僅僅可以對單一的質(zhì)量缺陷數(shù)據(jù)進行深入了解,而且模型可以針對影像的特征,面向用戶提出改進建議,進而推動企業(yè)進行工藝和質(zhì)量改進。
黃靖瑋則透露,未來他們將重點在兩個應用上探索與大模型的結(jié)合。一個是資料標注領域。此前AI質(zhì)檢應用過程里,資料數(shù)據(jù)標注需要花很長時間,還經(jīng)常遇到數(shù)據(jù)不足問題。他認為,如果能訓練出一個比較大型的通用瑕疵模型,在一些新的瑕疵出現(xiàn)時,不用去重新訓練模型,就能找出大部分瑕疵。未來在數(shù)據(jù)標注環(huán)節(jié),它可以大幅減少數(shù)據(jù)標注的成本。
另外大模型的泛化性強,使用少量的瑕疵數(shù)據(jù),把通用大模型蒸餾成一個小的質(zhì)檢模型。這樣這個質(zhì)檢模型可以部署到邊緣設備上,既能在準確率上達到客戶的要求,同時又一定程度保留了大模型的泛用能力。
華超杰告訴數(shù)智前線,基于大模型加AI質(zhì)量分析,阿里云將圍繞兩個核心應用場景作探索。一個應用場景在視覺場景中。比如在電網(wǎng)側(cè)做自動巡檢,巡檢算法需要有一些異常樣本,例如輸電線上的鳥巢。這些場景不是一直有,但可以通過大模型的AIGC能力,讓大模型去生成一些想要的場景,幫助去做模型的訓練。
另一個核心場景在數(shù)據(jù)智能產(chǎn)品上。利用設備的連續(xù)數(shù)據(jù)去分析質(zhì)量變化,這里面應用到了時序大模型。大語言模型本質(zhì)是預測下一個詞匯的概率然后生成。時序大模型里,設備的數(shù)據(jù)天然符合一個時間序列,用大模型的手段去實現(xiàn)這種神經(jīng)網(wǎng)絡的任務自動構(gòu)建,機器運轉(zhuǎn)有大量的歷史數(shù)據(jù),最后也能夠得出一個概率,運用到生產(chǎn)實踐中,能產(chǎn)生一些智能化結(jié)果,最終就能夠在長時間段和短時間精準捕捉異常。
目前,他們正在加緊用時序大模型加原有的AI質(zhì)量分析的方法結(jié)合在一起,去提升AI的質(zhì)檢分析能力。
而隨著AI質(zhì)檢解決方案商積極擁抱大模型技術,加強通用軟件平臺或硬件系統(tǒng)的研發(fā)和推廣以實現(xiàn)規(guī)?;瘡椭?,一些傳統(tǒng)的機器視覺玩家也在“變軟”。
一位云廠商的資深人士評價,設備廠商們增加智能能力,硬件公司增加算法等軟件能力的趨勢,會讓單一場景的算法企業(yè)變得非常被動?!白鰴z測設備的廠商們場景的標準化程度高,產(chǎn)線的價值也高,廠商們與企業(yè)本身就有采購關聯(lián)。在固有的采購上加一個智能算法,它進入工廠的難度更小。而如果純做軟件或算法服務商,可能能吃第一口,但后面就很容易被人家模仿。”
他也提到,有些算法企業(yè)為了能夠拿下項目,甚至以算法、硬件都免費的方式給企業(yè)做POC驗證。但這種模式從長遠看難以為繼。
對從AI算法起家的玩家而言,向老牌玩家們學習,從定制解決方案往標準化方向拓展,正成為能力建設的重點。
“未來,深入挖掘行業(yè),發(fā)現(xiàn)新的技術應用場景,利用大模型、AIGC 等新技術提高工業(yè)質(zhì)檢精度,可能是AI質(zhì)檢廠商們站穩(wěn)腳跟的重要途徑之一”,楊雯說。