近日,阿丘科技 CEO 黃耀受邀出席參與了由中信證劵舉辦的"獨角獸十問十答"產業策略會,以"AI重構工業視覺"為主題,分享了工業視覺領域市場發展現狀,當前AI 對工業視覺領域的影響和應用,以及剖析了未來 AI 在工業視覺領域的發展思想、新觀點、新路徑等。
以下為精簡版紀要
Q1
從技術角度看,AI將如何影響工業視覺?
一、維度提升,優化復雜問題的處理能力:Rule-based的方法受人工設計特征工程的維度限制,而深度神經網絡可實現維度的量級提升。以大模型為例,可達到一千億、二千億的參數空間維度,高維度下處理復雜問題更為簡便。
二、性能改進:一方面,降低現場運維成本,受傳統Rule-based技術的瓶頸限制,現有AOI設備為保持低漏檢率與低過殺率,需進行人工復判;AI可進一步減少對人力的依賴,進而提升成本效益。另一方面,在產品層面重構用戶的交互體驗,簡化操作流程。傳統的工業視覺依賴于Halcon或康耐視的Vision Pro,需對數百個算子進行預處理,工序復雜;而阿丘的AIDI軟件只有五個核心模塊,強調易用性。工業基礎視覺軟件正在從Software 1.0邁向 2.0,從Rule-based變成Smart Software后,用戶體驗發生質的飛躍。
三、通用泛化:實現跨領域通用,賦能碎片化工業視覺市場整合。工業領域包含電子、汽車、醫藥等眾多細分賽道,單一品類的市場容量不大,但多行業整合后的市場空間巨大。AI的通用泛化能力可推動解決工業視覺領域的第一性原理問題:如何實現碎片化市場的最大化覆蓋。
Q2
從商業模式角度,AI將如何影響工業視覺?
一、降低門檻,不再需要資深算法工程師進行檢測與復雜的應用,從業者只需對行業與軟件有基本認知即可;
二、重塑成本結構,研發成本降低,交付運維成本降低,短期內尤其是AI進入一個行業的早期階段會增加數據成本(包括數據維護或數據標注成本),但隨著時間會不斷降低,最終會走向基礎模型。未來三年整個行業的成本結構將大幅優化。
Q3
AI+工業視覺目前處于什么階段?
一、AI 1.0階段,核心為以算法為中心。1.0階段的算法特征為小樣本、高精度、低算力;落地方法論關注AI認知、需求邊界、數據與模型的管理;客戶群體普遍存在痛點,愿意擁抱新技術且有一定支付能力。主要問題為數據缺乏,上線部署周期長,如遇未知缺陷必須重新訓練,研發成本與定價偏高。
二、AI 2.0階段,核心為以數據為中心。一是開始累積行業數據,這是2.0階段的重點。某場景下的客戶達到一定數量后,累積的數據可協助在基礎模型上針對不同客戶的需求進行微調。二是形成工業 AI 視覺的標準化平臺,減少對人工的依賴。三是完善數據清洗、數據生成、分析輔助的工具鏈。2.0階段產品易用性將大幅提升,同時成本進一步下降,客戶關注性價比。此外,大規模的AI運行 scale up & scale out、場景復制和遷移泛化的問題是本階段的重點議題。
目前,阿丘正處于從1.0邁向2.0的上半場。整體而言,當前AI在工業視覺領域仍屬于逐步加速滲透的過程,預計到2024、2025年之后將開始加速普及。
Q4
工業視覺下游場景眾多,各自有什么特點?
一、最上層為半導體、面板與PCB,特點是工藝屬性強,不僅依賴技術能力,典型公司如KLA。該領域存在重大機會。
二、腰部市場,如汽車、電子、新能源領域。具有兩個典型特點:
1)極具創新力,以電池為例,有磷酸鐵鋰、三元電池、氫燃料電池、固態電池等多種形態。除頭部公司外,不斷有創業公司用顛覆性的創新方法重塑行業;
2)競爭激烈,市場規模大且快速變化,靠近消費者,難以形成一套標準解決方案。腰部市場需秉持解耦的理念,追求碎片化市場的覆蓋。
三、傳統行業,如食品、金屬加工等。特點是節奏慢,認知度不佳,客戶較少關注底層技術,更為關注解決具體問題的速度與產品易用性。因此在這類市場,產品力是制勝的關鍵點,而形成產品力的關鍵要素是易用性與快速部署。
Q5
除了仿真技術手段之外,還有什么方法可以加速corner cases的收集?
第一種方法是最早期采用的通過人為制造缺陷或PS缺陷數據,即與客戶商討該缺陷的特征和表現,以便公司能夠準確了解其特點。然而,這種方法存在一個問題,即如果客戶不提供足夠的信息,我們將無法準確了解該缺陷。因此,這種方法在早期使用較多,但后來逐漸減少。
第二種方法是利用AIGC來進行缺陷生成,通過模擬和生成缺陷的特征來解決問題。這種方法可以有效應對缺陷背后的復雜性,并且可以生成各種不同類型的缺陷,這是目前常用的一種方法。
第三種方法是利用非監督學習的方式,使用OK品進行建模。這種方法可以幫助公司更好地理解缺陷的特征和模式,從而提高缺陷檢測和修復的效果。
Q6
如何看待大模型對工業視覺領域的影響?
大模型是相對概念,用“基礎模型”描述更為準確。基礎模型包含兩層概念:
1)通用基礎模型,如SAM,能夠解決通用問題,但是解決方案較為粗略,在工業場景中無法直接使用。
2)行業基礎模型,如針對PCB行業的基礎模型或預制模型,阿丘已在這類模型中取得進展并實現商業化落地。
另一方面,大模型不能通吃一切,其可能符合To C端的通用需求,并誕生相應的公司。但對于To B類或垂類需求,會出現垂類的基礎模型(小模型)。最終的生態將是大模型+垂類的細分模型并存。
Q7
CV領域什么時候會迎來“ChatGPT時刻”?
目前在工業視覺的實際應用中,AI的應用仍屬于上一波的技術階段,主要是深度卷積神經網絡,其中神經網絡層數大約為20-30層或30-50層,根據具體情況進行選擇。
CV領域的“ChatGPT時刻”目前還沒有出現,顛覆性創新技術出現的時間具有不可預測性。Meta提出了SAM,得到資本市場瘋狂追捧,事實上只是邁出了一小步,CV領域的大模型依然需要一段時間。公司認為,CV領域一定會出現自己的ChatGPT,大概率由技術路線清晰的頭部大模型公司引領。
-
工業
+關注
關注
3文章
1859瀏覽量
46797 -
AI
+關注
關注
87文章
31359瀏覽量
269762 -
工業視覺
+關注
關注
0文章
72瀏覽量
7159
發布評論請先 登錄
相關推薦
評論