英國AI安全研究所推出AI模型安全評估平臺

據報道，英國人工智能安全研究院近日發布了名為“Inspect”的AI模型安全評估平臺，此平臺采用開源技術且對全球AI工程師免費開放，旨在提升模型性能與安全測評效率。

Inspect平臺包括“數據集”、“求解器（Solver）”、“評分器”三大模塊，用于評估AI模型在核心知識儲備、推理能力和自主能力等方面的表現。

根據模型測試結果，這些模塊會對各項指標進行評分。此外，Inspect平臺還支持Python外掛其他測試框架。

英國AI安全研究院院長Ian Hogarth表示，他們推出Inspect平臺的初衷在于“堅信開源的力量”，希望通過該平臺激發更多人參與貢獻，提高AI模型透明度和可重復性，并降低工程師的研發成本。

阅读全文

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

人工智能

人工智能

+關注

關注
1801

文章
48218

瀏覽量
243121
模型

模型

+關注

關注
1

文章
3435

瀏覽量
49579
開源技術

開源技術

+關注

關注
0

文章
389

瀏覽量
8034

《AI Agent 應用與項目實戰》----- 學習如何開發視頻應用

開發一個視頻內容生成Agent。訪問語聚AI平臺官網，進行注冊或登錄。在平臺首頁，了解語聚AI的功能和應用場景，特別是其支持的視頻生成相關的

發表于 03-05 19:52

IBM在watsonx.ai平臺推出DeepSeek R1蒸餾模型

，進一步增強企業在安全、治理以及規模化部署方面的能力。 DeepSeek R1是IBM在AI領域的一項重要創新，它采用了蒸餾模型技術，能夠在保持模型性能的同時，顯著減小

發表于 02-14 10:21 ?303次閱讀

AI開發平臺模型怎么用

AI開發平臺極大地簡化了AI應用的開發流程，從環境搭建、模型訓練到部署集成，每一步都提供了豐富的工具和資源。那么，AI開發

發表于 02-11 09:53 ?182次閱讀

企業AI模型托管怎么做的

當下，越來越多的企業選擇將AI模型托管給專業的第三方平臺，以實現高效、靈活和安全的模型運行。下面，AI

發表于 01-15 10:10 ?248次閱讀

美商務部推動AI模型預部署測試

性和可靠性，同時推動行業的健康發展。除了與這些企業的合作，美國人工智能安全研究所還與英國的安全研究所攜手，共同發布了首個聯合政府高級人工智

發表于 12-03 14:01 ?479次閱讀

芯盾時代的“AI+安全”之道

近日，全球領先的IT市場研究和咨詢公司IDC發布《生成式AI推動下的中國網絡安全軟件市場現狀和技術發展趨勢，2024》報告(以下簡稱《報告》)，評估眾多廠商

發表于 11-21 10:47 ?528次閱讀

使用NVIDIA AI平臺確保醫療數據安全

三井物產株式會社子公司借助 NVIDIA AI 平臺實現數據集的安全共享并使用在這些數據集上建立的強大模型加速藥物研發。

發表于 11-20 09:37 ?386次閱讀

AI即服務平臺的安全性分析

AIaaS平臺降低AI應用門檻，但面臨數據泄露、惡意攻擊等安全威脅。需加強數據加密、訪問控制、模型加固、供應鏈安全等措施，確保合法合規，提供

發表于 11-07 09:32 ?312次閱讀

如何評估AI大模型的效果

評估AI大模型的效果是一個復雜且多維度的過程，涉及多個方面的考量。以下是一些關鍵的評估方法和步驟：一、基準測試（Benchmarking）使用標準數據集和任務來

發表于 10-23 15:21 ?2159次閱讀

AI大模型的最新研究進展

AI大模型的最新研究進展體現在多個方面，以下是對其最新進展的介紹：一、技術創新與突破生成式AI技術的爆發：生成式AI技術正在迅速發展

發表于 10-23 15:19 ?987次閱讀

《AI for Science：人工智能驅動科學創新》第二章AI for Science的技術支撐學習心得

的訓練和推理提供了強大的算力支持，使得AI在科學研究中的應用更加廣泛和深入。 3. 數據驅動的研究范式第二章還強調了數據在AI for Science中的核心地位。數據是

發表于 10-14 09:16

OpenAI與Anthropic新模型將受美政府評估

近日，美國政府宣布了一項重要合作，旨在加強人工智能安全監管。根據協議，OpenAI與Anthropic兩大AI領軍企業同意，在推出新的AI模型

發表于 08-30 15:35 ?453次閱讀

微創軟件推出AI大模型應用平臺WISE

微創軟件在“2024微創人工智能戰略發布會”上，正式推出了企業級AI大模型應用平臺WISE。該平臺以其獨特的技術架構和卓越性能，為企業開發

發表于 05-31 11:31 ?1061次閱讀

STM CUBE AI錯誤導入onnx模型報錯的原因？

使用cube-AI分析模型時報錯，該模型是pytorch的cnn轉化成onnx ``` Neural Network Tools for STM32AI v1.7.0 (STM.

發表于 05-27 07:15

AI安全基準測試 v0.5: 聚焦通用聊天文本模型安全性

隨著AI技術的快速發展，相關安全問題也日益凸顯。僅過去數周內，便有LastPass公司遭遇音頻深度偽造攻擊等案例浮出水面。為了應對這一挑戰，新推出的AI Safety基準測試將成為

發表于 04-19 11:12 ?590次閱讀

微云疏影
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 對比各家主流MCU指標，國產MCU真的品質不佳？
Hot 模擬信號和數字信號的區別和特點

New 方正電機成為小鵬汽車驅動電機供應商，總需求量預計達35萬臺
New 雷諾-吉利動力總成合資企業HORSE在倫敦成立

发布文章

精選推薦
更多

文章

資料

帖子

英偉達Cosmos-Reason1 模型深度解讀

eeDesigner
1天前

226 閱讀

部署成本顯著降低！英特爾助陣高效AI算力一體機方案

章鷹觀察
1天前

324 閱讀

零知開源——ESP32語音交互系統（AI小智）開發教程

PCB56242069
1天前

489 閱讀

2EP1XXR系列全橋變壓器驅動器工作原理（一）——如何通過占空比調節峰值整流應用下的輸出電壓

英飛凌工業半導體
2天前

457 閱讀

從DeepSeek到Qwen，AI大模型的移植與交互實戰指南-飛凌嵌入式

飛凌嵌入式
2天前

509 閱讀

ERP完整開發資料整理

林鴻斌
593 KB

免費

0下載

BOSH Cloud Foundry大規模部署工具

樂騫添
22.84 MB

2積分

1下載

Stetho Realm用于Stetho的Realm模塊

發燒友推溫針
0.08 MB

2積分

1下載

duck-editor鴨子編輯器

李娟
1.57 MB

2積分

2下載

PixPic圖片編輯應用

qjqb
8.30 MB

免費

0下載

GD32串口高效率數據收發：多方案深度解析與實戰

李旭昂
2天前

134 閱讀

求助！PWM控制LED沒反應，救救孩子吧[大哭]

jf_24161297
2天前

249 閱讀

最新 HUAWEI DevEco Studio 調試技巧

jf_22972444
1天前

135 閱讀

大家幫我看下仿真不明白這的電壓為什么會升高

jf_36460324
1天前

257 閱讀

《電子發燒友電子設計周報》聚焦硬科技領域核心價值第5期：2025.03.24--2025.03.28

電子人steve
3天前

954 閱讀

推薦專欄
更多