據報道,英國人工智能安全研究院近日發布了名為“Inspect”的AI模型安全評估平臺,此平臺采用開源技術且對全球AI工程師免費開放,旨在提升模型性能與安全測評效率。
Inspect平臺包括“數據集”、“求解器(Solver)”、“評分器”三大模塊,用于評估AI模型在核心知識儲備、推理能力和自主能力等方面的表現。
根據模型測試結果,這些模塊會對各項指標進行評分。此外,Inspect平臺還支持Python外掛其他測試框架。
英國AI安全研究院院長Ian Hogarth表示,他們推出Inspect平臺的初衷在于“堅信開源的力量”,希望通過該平臺激發更多人參與貢獻,提高AI模型透明度和可重復性,并降低工程師的研發成本。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
人工智能
+關注
關注
1801文章
48218瀏覽量
243121 -
模型
+關注
關注
1文章
3435瀏覽量
49579 -
開源技術
+關注
關注
0文章
389瀏覽量
8034
發布評論請先 登錄
相關推薦
《AI Agent 應用與項目實戰》----- 學習如何開發視頻應用
開發一個視頻內容生成Agent。
訪問語聚AI平臺官網 ,進行注冊或登錄。
在平臺首頁,了解語聚AI的功能和應用場景,特別是其支持的視頻生成相關的
發表于 03-05 19:52
IBM在watsonx.ai平臺推出DeepSeek R1蒸餾模型
,進一步增強企業在安全、治理以及規模化部署方面的能力。 DeepSeek R1是IBM在AI領域的一項重要創新,它采用了蒸餾模型技術,能夠在保持模型性能的同時,顯著減小
美商務部推動AI模型預部署測試
性和可靠性,同時推動行業的健康發展。 除了與這些企業的合作,美國人工智能安全研究所還與英國的安全研究所攜手,共同發布了首個聯合政府高級人工智
芯盾時代的“AI+安全”之道
近日,全球領先的IT市場研究和咨詢公司IDC發布《生成式AI推動下的中國網絡安全軟件市場現狀和技術發展趨勢,2024》報告(以下簡稱《報告》),評估眾多廠商
使用NVIDIA AI平臺確保醫療數據安全
三井物產株式會社子公司借助 NVIDIA AI 平臺實現數據集的安全共享并使用在這些數據集上建立的強大模型加速藥物研發。
AI即服務平臺的安全性分析
AIaaS平臺降低AI應用門檻,但面臨數據泄露、惡意攻擊等安全威脅。需加強數據加密、訪問控制、模型加固、供應鏈安全等措施,確保合法合規,提供
如何評估AI大模型的效果
評估AI大模型的效果是一個復雜且多維度的過程,涉及多個方面的考量。以下是一些關鍵的評估方法和步驟: 一、基準測試(Benchmarking) 使用標準數據集和任務來
AI大模型的最新研究進展
AI大模型的最新研究進展體現在多個方面,以下是對其最新進展的介紹: 一、技術創新與突破 生成式AI技術的爆發 : 生成式AI技術正在迅速發展
《AI for Science:人工智能驅動科學創新》第二章AI for Science的技術支撐學習心得
的訓練和推理提供了強大的算力支持,使得AI在科學研究中的應用更加廣泛和深入。
3. 數據驅動的研究范式
第二章還強調了數據在AI for Science中的核心地位。數據是
發表于 10-14 09:16
OpenAI與Anthropic新模型將受美政府評估
近日,美國政府宣布了一項重要合作,旨在加強人工智能安全監管。根據協議,OpenAI與Anthropic兩大AI領軍企業同意,在推出新的AI模型
微創軟件推出AI大模型應用平臺WISE
微創軟件在“2024微創人工智能戰略發布會”上,正式推出了企業級AI大模型應用平臺WISE。該平臺以其獨特的技術架構和卓越性能,為企業開發
STM CUBE AI錯誤導入onnx模型報錯的原因?
使用cube-AI分析模型時報錯,該模型是pytorch的cnn轉化成onnx
```
Neural Network Tools for STM32AI v1.7.0 (STM.
發表于 05-27 07:15
AI安全基準測試 v0.5: 聚焦通用聊天文本模型安全性
隨著AI技術的快速發展,相關安全問題也日益凸顯。僅過去數周內,便有LastPass公司遭遇音頻深度偽造攻擊等案例浮出水面。為了應對這一挑戰,新推出的AI Safety基準測試將成為
評論