风凌天下,小说排行榜完结版,辰东全部小说

小模型的風潮，最近愈來愈盛，Mistral和微軟分別有所動作。而網友實測發現，Mistral-medium的代碼能力竟然完勝了GPT-4，而所花成本還不到三分之一。

最近，「小語言模型」忽然成為熱點。

本周一，剛剛完成4.15億美元融資的法國AI初創公司Mistral，發布了Mixtral 8x7B模型。

這個開源模型盡管尺寸不大，小到足以在一臺內存100GB以上的電腦上運行，然而在某些基準測試中卻能和GPT-3.5打平，因此迅速在開發者中贏得了一片稱贊。

之所以叫Mixtral 8x7B，是因為它結合了為處理特定任務而訓練的各種較小模型，從而提高了運行效率。

這種「稀疏專家混合」模型并不容易實現，據說OpenAI在今年早些時候因為無法讓MoE模型正常運行，而不得不放棄了模型的開發。

緊接著，就在第二天，微軟又發布了全新版本的Phi-2小模型。

跟Mistral的70億參數比，Phi-2小到可以在手機上跑，只有27億參數。相比之下，GPT-4的參數達到了一萬億。

Phi-2在精心挑選的數據集上進行了訓練，數據集的質量足夠高，因此即使手機的計算能力有限，也能確保模型生成準確的結果。

雖然還不清楚微軟或其他軟件制造商將如何使用小型模型，但最明顯的好處，就是降低了大規模運行AI應用的成本，并且極大地拓寬了生成式AI技術的應用范圍。

這是一件大事。

Mistral-medium代碼生成完勝GPT-4

最近，Mistral-medium已經開放內測。

有博主對比了開源的Mistral-medium和GPT-4的代碼生成能力，結果顯示，Mistral-medium比GPT-4的代碼能力更強，然而成本卻只需GPT-4的3成！

總價來說就是：

1）Mistral會始終完成工作，完成度很高；

2）不會在冗長的解釋性輸出上浪費token；

3）提供的建議非常具體。

第一題，「編寫用于生成斐波那契素數的PyTorch數據集的cuda優化代碼」。

Mistral-Medium生成的代碼嚴肅、完整。

而GPT-4生成的代碼，就差強人意了。

浪費了很多token，卻沒有輸出有用的信息。

然后，GPT-4只給出了骨架代碼，并沒有具體的相關代碼。

第二道題：「編寫高效的Python代碼，將大約10億個大型Apache HTTP訪問文件攝取到 SqlLite數據庫中，并使用它來生成對sales.html和product.html的訪問直方圖」。

Mistral的輸出非常精彩，雖然log不是CSV格式的，但修改起來很容易。

GPT-4依舊拉跨。

此前，這位博主測試過多個代碼生成模型，GPT-4一直穩居第一。

而現在，把它拉下寶座的強勁對手Mistral-medium終于出現了。

雖然只發布了兩個例子，但博主測試了多個問題，結果都差不多。

他建議：鑒于Mistral-medium在代碼生成質量上有更好的體驗，應該把它整合到各地的代碼copilot中。

有人按照每1000token算出了輸入和輸出的成本，發現Mistral-medium比起GPT-4直接降低了70%！

的確，節省了70%的token費用，可不是一件小事。甚至還可以通過不冗長的輸出，來進一步節省成本。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

模型

模型

+關注

關注
1

文章
3279

瀏覽量
48974
代碼

代碼

+關注

關注
30

文章
4808

瀏覽量
68816
語言模型

語言模型

+關注

關注
0

文章
533

瀏覽量
10300

原文標題：Mistral攜微軟引爆「小語言模型」潮！Mistral中杯代碼能力完勝GPT-4，成本暴降2/3

文章出處：【微信號：zenRRan，微信公眾號：深度學習自然語言處理】歡迎添加關注！文章轉載請注明出處。

Llama 3 與 GPT-4 比較

隨著人工智能技術的飛速發展，我們見證了一代又一代的AI模型不斷突破界限，為各行各業帶來革命性的變化。在這場技術競賽中，Llama 3和GPT-4作為兩個備受矚目的模型，它們代表了當前AI領域的最前

發表于 10-27 14:17 ?401次閱讀

科大訊飛發布訊飛星火4.0 Turbo:七大能力超GPT-4 Turbo

超過GPT-4 Turbo，數學能力和代碼能力更是超過了Open AI最新一代GPT模型GPT-4

發表于 10-24 11:39 ?505次閱讀

Mistral Large 2現已在Amazon Bedrock中正式可用

。Mistral Large 2是Mistral Large的最新版本，Mistral AI表示其在多語言能力、數學、推理、

發表于 07-26 08:07 ?358次閱讀

OpenAI推出新模型CriticGPT，用GPT-4自我糾錯

基于GPT-4的模型——CriticGPT，這款模型專為捕獲ChatGPT代碼輸出中的錯誤而設計，其獨特的作用在于，讓人們能夠用GPT-4來查找GP

發表于 06-29 09:55 ?569次閱讀

OpenAI API Key獲取：開發人員申請GPT-4 API Key教程

? OpenAI的GPT-4模型因其卓越的自然語言理解和生成能力，成為了許多開發者的首選工具。獲取GPT-4 API Key并將其應用于項目，如開發一個ChatGPT聊天應用，不僅是實踐人工智能技術

發表于 06-24 17:40 ?2458次閱讀

開發者如何調用OpenAI的GPT-4o API以及價格詳情指南

，高達每分鐘1000萬字符。速度：GPT-4o的速度是GPT-4 Turbo的兩倍。視覺能力：在視覺能力相關的評估中，

發表于 05-29 16:00 ?1.2w次閱讀

GPT-4人工智能模型預測公司未來盈利勝過人類分析師

據悉，本次研究中，研究人員僅向GPT-4提供了匿名的財務數據，包括資產負債表和損益表，并要求其預測未來盈利增長。盡管未獲得其他信息，GPT-4仍能達到60%的準確度，遠超人類分析師的平均水平（53%-57%）。

發表于 05-27 16:41 ?626次閱讀

OpenAI全新GPT-4o能力炸場！速度快/成本低，能讀懂人類情緒

”的意思。GPT-4o文本、推理、編碼能力達到GPT-4 Turbo水平，速度是上一代AI大模型GPT-4 Turbo的兩倍，但成本僅為

發表于 05-15 00:15 ?7871次閱讀

阿里云發布通義千問2.5大模型，多項能力超越GPT-4

阿里云隆重推出了通義千問 2.5 版，宣稱其“技術進步，全面超越GPT-4”，尤其是在中文環境中的多種任務（如文本理解、文本生成、知識問答及生活建議、臨時聊天及對話以及安全風險評估）方面表現出色，超越了GPT-4。

發表于 05-09 14:17 ?984次閱讀

商湯科技發布5.0多模態大模型，綜合能力全面對標GPT-4 Turbo

商湯科技發布5.0多模態大模型，綜合能力全面對標GPT-4 Turbo 4月23日，商湯科技董事長兼CEO徐立在2024商湯技術交流日上發布了行業首個云、端、邊全棧大模型產品矩陣，能夠滿足不同規模

發表于 04-24 16:49 ?1142次閱讀

微軟Copilot全面更新為OpenAI的GPT-4 Turbo模型

起初，Copilot作為Bing Chat AI助手推出，初期采用GPT-3.5模型，隨后升級至GPT-4取得顯著進步，如今再次更新至性能卓越的GPT-4 Turbo模型，這無疑將使得Copilot功能再上新臺階。

發表于 03-13 13:42 ?760次閱讀

新火種AI|秒殺GPT-4，狙殺GPT-5，橫空出世的Claude 3振奮人心！

的GPT-4被拉下神壇， Claude 3很可能對GPT-4實現全方位的碾壓。 Anthropic發布3個模型，全方位實現

發表于 03-06 22:22 ?693次閱讀

全球最強大模型易主，GPT-4被超越

近日，AI領域的領軍企業Anthropic宣布推出全新的Claude 3系列模型，其中包括最強版Claude 3 Opus。據該公司稱，Claude 3系列在推理、數學、編碼、多語言理解和視覺方面全面超越了包括

發表于 03-05 09:58 ?685次閱讀

Anthropic推出Claude 3系列模型，全面超越GPT-4，樹立AI新標桿

近日，AI領域的領軍企業Anthropic震撼發布了全新的Claude 3系列模型，該系列模型在多模態和語言能力等關鍵領域展現出卓越性能，成功擊敗了此前被廣泛認為是全球最強AI模型的GPT-4，樹立了新的行業基準。

發表于 03-05 09:49 ?716次閱讀

全球最強大模型易主：GPT-4被超越，Claude 3系列嶄露頭角

近日，人工智能領域迎來了一場革命性的突破。Anthropic公司發布了全新的Claude 3系列模型，該系列模型在多模態和語言能力等關鍵指標上展現出卓越性能，成功超越了此前被廣泛認為是全球最強AI模型的GPT-4，樹立了新的行業

發表于 03-05 09:42 ?682次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

Mistral中杯代碼能力完勝GPT-4，成本暴降2/3

評論

Llama 3 與 GPT-4 比較

科大訊飛發布訊飛星火4.0 Turbo:七大能力超GPT-4 Turbo

Mistral Large 2現已在Amazon Bedrock中正式可用

OpenAI推出新模型CriticGPT，用GPT-4自我糾錯

OpenAI API Key獲取：開發人員申請GPT-4 API Key教程

開發者如何調用OpenAI的GPT-4o API以及價格詳情指南

GPT-4人工智能模型預測公司未來盈利勝過人類分析師

OpenAI全新GPT-4o能力炸場！速度快/成本低，能讀懂人類情緒

阿里云發布通義千問2.5大模型，多項能力超越GPT-4

商湯科技發布5.0多模態大模型，綜合能力全面對標GPT-4 Turbo

微軟Copilot全面更新為OpenAI的GPT-4 Turbo模型

新火種AI|秒殺GPT-4，狙殺GPT-5，橫空出世的Claude 3振奮人心！

全球最強大模型易主，GPT-4被超越

Anthropic推出Claude 3系列模型，全面超越GPT-4，樹立AI新標桿

全球最強大模型易主：GPT-4被超越，Claude 3系列嶄露頭角