微軟研究院近期公開發布了Phi-3系列AI模型,該系列包括mini版(38億參數)、small版(70億參數)以及medium版(140億參數)。
微軟稱,帶有38億參數的phi-3-mini經過3.3萬億token的強化學習,其基礎表現已經超過Mixtral 8x7B及GPT-3.5;此外,該模型可在手機等移動設備上運行,并在phi-2模型(27億參數)的基礎上,進一步融合了嚴格篩選的網絡數據與合成數據。
盡管phi-3-mini在語言理解和推理方面已能匹敵大參數模型,但在TriviaQA等特定任務中仍受限于模型規模。
值得注意的是,phi-3-small和phi-3-medium兩款模型在MMLU測試中的得分分別達到了75.3和78.2。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
微軟
+關注
關注
4文章
6598瀏覽量
104066 -
移動設備
+關注
關注
0文章
496瀏覽量
54710 -
強化學習
+關注
關注
4文章
266瀏覽量
11256
發布評論請先 登錄
相關推薦
在英特爾酷睿Ultra7處理器上優化和部署Phi-3-min模型
2024年4月23日,微軟研究院公布Phi-3系列AI大模型,包含三個版本:mini(3.8B參數)、small(7B參數)以及medium(14B參數)。
OpenAI 推出 GPT-4o mini 取代GPT 3.5 性能超越GPT 4 而且更快 API KEY更便宜
GPT-4. GPT-4o mini的定價為每百萬輸入標記15美分和每百萬輸出標記60美分,比之前的前沿模型便宜了一個數量級,比GPT-3.5 Turbo便宜了60%以上。
Anthropic 發布Claude 3.5 Sonnet模型運行速度是Claude 3 Opus的兩倍
Anthropic 發布Claude 3.5 Sonnet最新模型 新模型在推理、知識和編碼能力評估方面超越了以前的版本和競爭對手
微軟發布PhI-3-Vision模型,提升視覺AI效率
Phi-3-vision 是一種小型多模式語言模型(SLM),主要適用于本地人工智能場景。其模型參數高達 42 億,上下文序列包含 128k 個符號,可滿足各種視覺推理和其他任務需求。
微軟發布視覺型AI新模型:Phi-3-vision
據悉,Phi-3-vision 作為微軟 Phi-3 家族的首款多模態模型,繼承自 Phi-3-mini 的文本理解能力,兼具輕巧便攜特性
英特爾優化AI產品組合,助力微軟Phi-3家族模型
近日,英特爾宣布針對微軟的Phi-3家族開放模型,成功驗證并優化了其跨客戶端、邊緣及數據中心的AI產品組合。這一重要舉措旨在提供更為靈活和高效的AI
英特爾與微軟合作在其AI PC及邊緣解決方案中支持多種Phi-3模型
近日,英特爾針對微軟的多個Phi-3家族的開放模型,驗證并優化了其跨客戶端、邊緣和數據中心的AI產品組合。
微軟Build 2024:宣布開放AI GPT-40及Phi-3-visio
5 月 22 日,微軟Build 2024大會在美正式開幕。薩提亞·納德拉CEO、董事長宣布,OpenAI新款旗艦模型GPT-4o已經在Azure AI Studio上線,并開放API
NVIDIA加速微軟最新的Phi-3 Mini開源語言模型
NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個開源庫,用于優化從 PC 到云端的 NVIDIA GPU 上運行的大語言
Meta推出新一代語言模型LLAMA 3,性能優于GPT-3.5
Meta決定將Llama 3的80億參數版開源,以期讓更多人能夠接觸到尖端的AI技術。全球范圍內的開發者、研究員以及對AI充滿好奇的人士均可參與其中,進行游戲開發、模型構建與實驗探索。
蘋果ReALM模型在實體識別測試中超越OpenAI GPT-4.0
“我們的模型在識別各種類型實體方面都有顯著提升,即使是小尺寸模型,在屏幕實體識別準確性上也已超過原有的系統5%以上。在與GPT-3.5和GPT-4.0的比較中,小型
微軟Copilot全面更新為OpenAI的GPT-4 Turbo模型
起初,Copilot作為Bing Chat AI助手推出,初期采用GPT-3.5模型,隨后升級至GPT-4取得顯著進步,如今再次更新至性能卓
全球最強大模型易主,GPT-4被超越
近日,AI領域的領軍企業Anthropic宣布推出全新的Claude 3系列模型,其中包括最強版Claude 3 Opus。據該公司稱,Claude
Anthropic推出Claude 3系列模型,全面超越GPT-4,樹立AI新標桿
近日,AI領域的領軍企業Anthropic震撼發布了全新的Claude 3系列模型,該系列模型在多模態和語言能力等關鍵領域展現出卓越
全球最強大模型易主:GPT-4被超越,Claude 3系列嶄露頭角
近日,人工智能領域迎來了一場革命性的突破。Anthropic公司發布了全新的Claude 3系列模型,該系列模型在多模態和語言能力等關鍵指標上展現出卓越
評論