作者 |梵高先生
小編 | 不吃豬頭肉
引言:AI 的機遇與挑戰
自從 ChatGPT 橫空出世以來,人工智能似乎一夜之間變得無處不在。在日常使用中,我們常常在驚艷與失望之間徘徊:它有時能展現出令人驚嘆的能力,洞察深刻、對答如流,有時卻又犯下令人哭笑不得的錯誤。正如 ChatGPT 官方頁面的警示語所說:“ChatGPT 也可能會犯錯。請核查重要信息。” 這提醒我們,盡管 AI 技術突飛猛進,但要將其轉化為實際生產力,還需要深入的思考和探索。
在工程領域,特別是汽車電子測試這樣的專業領域,我們更需要理性地看待 AI 的能力。不同于日常的聊天問答,工程領域對工具的可靠性、穩定性和可預測性有著極高的要求。那么,在這樣的專業領域中,什么樣的 AI 應用才是真正有價值的?AI 又該如何與現有的工作流程深度融合,真正幫助工程師提升工作效率?這些都是我們需要認真思考的問題。
今年初,我們給小北同學已經配上了AI智能助理PiHoo,看看他們配合得怎樣了?
汽車電子測試的復雜性與 AI 應用機會
汽車電子測試是一個專業性強、流程復雜的領域。從測試項目啟動開始,工程師們就要經歷一系列嚴謹而復雜的工作環節:首先需要深入分析需求文檔,制定相應的測試策略;繼而設計測試用例并組織評審;之后要搭建和配置測試環境,開發測試腳本;最后是執行測試,進行問題分析,生成測試報告,并對測試結果進行驗證確認。每一個環節都需要專業的知識和豐富的經驗,任何一個環節的疏漏都可能影響最終的測試質量。
在這些復雜的工作流程中,AI 可以作為工程師的得力助手,在多個關鍵環節發揮重要作用。
在測試需求分析階段,AI 可以輔助處理和解析復雜的需求文檔,幫助工程師提取關鍵的測試點,識別需求中潛在的風險。當進入測試用例設計階段,AI 能夠推薦合適的測試場景,輔助生成基礎的測試用例,并提供測試覆蓋度分析,幫助工程師確保測試的完整性。在測試腳本開發階段,AI 可以顯著提升效率:它能夠根據測試用例自動生成測試腳本框架,提供代碼補全和優化建議,輔助識別潛在的代碼缺陷。在腳本調試過程中,AI 可以分析執行日志,輔助定位問題,并給出修復建議。這可以加快開發速度。到了測試執行階段,AI 的價值同樣顯著。它可以協助優化測試執行策略,生成部分測試數據,在發現異常時及時預警。測試完成后,AI 還能分析測試日志,對問題進行分類,并協助生成規范的測試報告,提升測試后期工作的效率。通過在這些特定環節中融入 AI 能力,可以顯著提升工程師的工作效率,減少重復性工作。
然而,要真正實現這些目標,我們必須首先正視當前 AI 技術面臨的幾個主要挑戰。
當前 AI 在工程領域面臨的主要挑戰
1. 自然語言的固有局限
人們常說,被誤解是表達者的宿命。這源于自然語言與生俱來的模糊性和不確定性。正是因為這個原因,在工程領域,人們發明了各種專門的語言,如編程語言和建模語言等,以降低信息傳達過程中的不確定性。然而,當 AI 來處理這些自然語言時,同樣會面臨理解偏差的問題。為了確保 AI 能夠準確理解輸入文本中表達的意圖,我們必須建立完善的機制,比如增加評審和測試環節,以驗證 AI 的理解是否與人類的預期相符。這種驗證機制不僅是對 AI 輸出的把關,更是確保整個工作流程可靠性的重要保障。
2. 復雜圖表處理能力不足
在汽車電子測試領域的需求文檔中,各種專業術語和復雜圖表是不可或缺的表達方式。然而,當前的大語言模型(LLM)最擅長處理的是純文本數據,即便具備了多模態處理能力,要完全理解工程領域中那些專業的、復雜的圖表依然是一個巨大的挑戰。為了解決這個問題,需要精心設計處理流程,將LLM 不擅長處理的信息轉換為它能夠理解的純文本格式,如 JSON 或 Markdown 等。但任何轉換過程都不可避免地會造成信息損失,因此在設計這樣的處理流程時,必須考慮如何控制信息損失,并建立有效的異常提示機制,確保在關鍵信息可能丟失時及時警示用戶。
3. 上下文長度限制
上下文長度的限制是當前大語言模型面臨的一個顯著瓶頸。例如 32k token 的上下文長度,換算成英文文本大約是 50~100 頁左右,這其中還沒有考慮連續對話占用的空間。在實際工程應用中,需求文檔動輒幾百上千頁,遠超模型的處理能力。需要對文檔進行分段處理,但這又帶來了新的挑戰:在一份完整的工程需求文檔中,不同段落之間存在著復雜的互相引用和依賴關系。簡單的分段處理可能導致 AI 無法完整理解某個需求片段的完整語境。因此,所需要的預處理機制,在保證每個片段長度適中的同時,還要能為 AI 提供充分的上下文信息,使其能夠準確理解每個需求片段在整體系統中的位置和意義。
4. 幻覺問題
大語言模型的"幻覺"問題,即模型生成看似合理但實際錯誤的內容,這在工程應用中是不能接受的。當我們把 AI 視為一種工程工具時,如果這個工具本身無法檢測或預防可能出現的錯誤,使用它將會帶來難以預估的風險。在汽車電子測試這樣對可靠性要求極高的領域,AI 的每一個輸出都可能影響到測試的質量和結果的可靠性。因此就必須建立一套輸出驗證和監控機制,根據 AI 輸出結果的影響程度和范圍,設置相應的驗證流程和質量控制門檻,確保每一個 AI 的輸出都經過充分的驗證和確認。
5. 專業知識體系的局限
當前的大語言模型雖然經過了海量數據的訓練,但在特定專業領域的知識掌握仍然不夠深入和系統。在汽車電子測試領域,存在大量的專業標準規范(如 ISO 26262、ASPICE 等)、測試方法論和最佳實踐,這些專業知識往往需要多年的實踐和積累才能真正掌握。AI 在處理這些專業問題時,可能會出現理解片面或者無法準確把握具體場景需求的情況。因此,在應用 AI 工具時,我們需要建立專門的行業知識庫來增強 AI 在特定領域的專業能力。
6. 工具鏈集成的挑戰
汽車電子測試領域已經形成了一套成熟的工具鏈生態,包括需求管理工具、測試用例管理系統、自動化測試平臺、缺陷跟蹤系統等。要讓 AI 真正發揮作用,就必須能夠與這些既有的工具鏈無縫集成。然而,不同工具之間的數據格式、接口協議可能存在差異,如何讓 AI 能夠準確理解和處理這些工具產生的數據,如何確保 AI 的輸出能夠被這些工具正確接收和使用,都是需要解決的技術難題。
結語
在汽車電子測試這樣的專業工程領域,我們需要的顯然不是一個簡單的聊天機器人。工程師們需要的是一個可靠的、值得信賴的問題解決工具。這個工具的輸出必須是穩定、一致且可預期的 —— 我們不期待它帶來任何“驚喜”,更不能容忍“驚嚇”。即便它每次只能給出 60 分的結果,我們也希望它能保持這個水準,而不是時而 40 分,時而又達到 80 分。同時,這個工具必須具有清晰明確的能力邊界,能夠識別出什么是它可以勝任的,什么是超出其能力范圍的。更重要的是,它需要具備完善的錯誤檢測機制,在出現問題時能夠及時向用戶發出警示。只有同時滿足這些要求,AI 工具才能真正在工程實踐中發揮其價值,成為工程師可靠的助手。
作為深耕汽車電子測試領域十余年的專業咨詢公司,北匯信息對 AI 技術保持開放的態度。我們將充分發揮在汽車電子測試領域的專業優勢和豐富經驗,探索 AI 技術與傳統測試服務的融合。
-
測試
+關注
關注
8文章
5303瀏覽量
126658 -
汽車電子
+關注
關注
3026文章
7955瀏覽量
167046 -
AI
+關注
關注
87文章
30896瀏覽量
269111
發布評論請先 登錄
相關推薦
評論