在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌發布史上最強大模型Gemini,全方位領先GPT-4,MMLU基準達人類專家水平

Felix分析 ? 來源:電子發燒友網 ? 作者:吳子鵬 ? 2023-12-08 00:11 ? 次閱讀

電子發燒友網報道(文/吳子鵬)美國當地時間周三,谷歌發布了其新一代人工智能模型Gemini(雙子星)。谷歌CEO桑達爾?皮查伊和Deepmind CEO戴密斯·哈薩比斯在谷歌官網聯名發文,官宣了最新多模態大模型Gemini 1.0版本正式上線。

這次發布是按照谷歌此前的預期,但是對于業界而言非常突然。因為就在一周前還有報告指出,谷歌原本計劃本周(當時稱下周)發布Gemini,但現在已經推遲到2024年1月。報告給出的原因是,谷歌“發現人工智能不能可靠地處理一些非英語查詢”,該公司認為全球語言支持是最重要的,這是谷歌追趕和超越OpenAI GPT-4的關鍵性能之一。

現在,谷歌還是如期將Gemini 1.0上線了。

史上最強的AI大模型

從定位來看,Gemini 1.0版本是桑達爾?皮查伊親自督導,籌備一年多時間,并瞄準OpenAI GPT-4的大模型。很顯然,Gemini 1.0版本的效果是遠超預期的,成為目前已經上線發布的最強大的AI大模型,也是有史以來最強大的AI大模型。

據介紹,Gemini 1.0版本會有三個細分的版本:
·Gemini Ultra:谷歌最大、最強模型,適用于高度復雜的任務
·Gemini Pro:可擴展至各種任務的Gemini模型
·Gemini Nano:適用于端側設備的高效Gemini版本(1.8B/3.25B)

Gemini 1.0版本是一個純正的多模態AI大模型,為什么要這樣說呢?因為Gemini是以多模態模型為目標重新構建的,在復雜操作以及處理不同類型信息方面,其效率和絲滑度是當前其他模型不可比擬的,這些信息包括文本、代碼、音頻、圖像和視頻。所以,Gemini也是迄今為止最靈活的大模型。

在基礎設施方面,谷歌使用自研的Tensor處理單元(TPU)v4和v5e對Gemini 1.0進行訓練。因此,在Gemini 1.0版本發布的同時,谷歌也宣布推出迄今為止最強大、最高效、最可擴展的TPU系統Cloud TPU v5p,專為訓練尖端人工智能模型而設計。根據此前的爆料,Gemini 1.0版本訓練需要的算力規模是GPT-4的5倍。

全新的設計和強大的算力底座,讓Gemini 1.0版本成了一個性能怪獸。根據谷歌發布的報告,在32項廣泛使用的基準測試中,Gemini Ultra獲得了30個SOTA(State of the art,特指領先水平的大模型)。能夠看出,Gemini 1.0版本在文本、代碼、音頻、圖像和視頻處理能力方面,以及推理、數學、代碼等方面的能力均比GPT-4更加出色,可以說是全方位吊打GPT-4。

wKgaomVxm3GAPuUaAAIVrdTtGvI369.gif
圖源:谷歌
wKgaomVxm3qAFIe5AAK33lJNSCI784.gif
圖源:谷歌

根據以上兩圖,Gemini在MMLU(大規模多任務語言理解數據集)和MMMU(基于大學考試的測試基準)的成績格外值得關注。其中,Gemini Ultra在MMLU測試中的得分率高達 90.0%,首次超越了人類專家。MMLU數據集包含數學、物理、歷史、法律、醫學和倫理等 57 個科目,用于測試大模型的知識儲備和解決問題能力。

在權威MMMU測試中,Gemini Ultra也獲得了59.4%的SOTA分數。MMMU由IN.AI Research 等多所機構組成的研究團隊一同推出,可用于評估AI在大學水平的多學科問題上的多模態理解和推理能力。其中包含的問題來自大學考試、測驗和教科書,涉及六個常見學科:藝術與設計、商科、科學、健康與醫學、人文與社會科學、技術與工程。MMMU包含1.15萬個精心選取的多模態問題,涵蓋30個不同的科目和183個子領域,因此滿足廣度目標。谷歌認為,在MMMU中取得這樣的分數,證明Gemini在更復雜推理任務中還有更大的潛力值得挖掘。

谷歌認為,Gemini作為一個原生的多模態大模型,和單獨訓練拼接而成的多模態大模型有很大的不同,帶來了巨大的性能提升,并通過多模式級聯的數據進行了調優,以進一步完善其有效性。這就是為什么,Gemini幾乎在任何領域都是最領先的。

在谷歌發布的報告中,該公司基于Gemini進行了復雜推理的顯示,比如Gemini可以非常高效地從數十萬份文件中獲取對科學家有用的數據,并創建數據集。你甚至可以讓它幫你給這些有價值的數據做進一步的標注。

在另一個案例中,Gemini可以在世界上最受歡迎的編程語言(如PythonJavaC++和Go)中理解、解釋和生成高質量的代碼。由于對全球語言都有很好的支持,Gemini可以跨語言工作并對復雜信息進行推理,使其成為世界上領先的編碼的基礎模型之一。基于Gemini,谷歌創建了一個更先進的代碼生成系統AlphaCode 2,該系統擅長解決超越編碼的競爭性編程問題,涉及復雜的數學和理論計算機科學。

憑借GPT大模型,OpenAI這幾年的風頭蓋過了谷歌,現在憑借Gemini,谷歌打了一個漂亮的翻身仗。不過,桑達爾?皮查伊在接受采訪時表示,Gemini只是領先GPT-4一點點,“想想看,向人工智能的轉變是多么深刻,我們還處于早期階段,前方的世界充滿機遇。”

谷歌表示,Gemini將通過谷歌產品推向數十億用戶。從12月13日開始,開發者和企業客戶可以通過Google AI Studio或Google Cloud Vertex AI中的Gemini API訪問Gemini Pro。2024年初,谷歌還將推出Bard Advanced,這是一種新的頂級人工智能體驗,讓用戶從Gemini Ultra開始訪問谷歌最好的模型和功能。

更強的功能與更大的擔憂

在Gemini的介紹報告中,谷歌花費很大篇幅來闡述責任和安全。在報告中谷歌提到,“在谷歌,我們致力于在我們所做的一切工作中推進大膽和負責任的人工智能。基于谷歌的人工智能原則和我們產品的強大安全政策,我們正在添加新的保護措施來保證Gemini的多模式聯運能力。在開發的每個階段,我們都在考慮潛在風險,并努力測試和減輕它們。”

“我們對迄今為止的任何谷歌人工智能模型進行了最全面的安全評估,包括偏見和數據毒性。我們對網絡犯罪、說服和自主意識等潛在風險領域進行了新的研究,并應用了谷歌一流的對抗性測試技術,以幫助在Gemini部署之前識別關鍵安全問題。”

同時,為了減少測試的盲點,谷歌也在與外部專家和合作伙伴一起進行壓力測試。然而,就像桑達爾?皮查伊提到,很多基準測試還在逐步完善一樣,實際上對于AI大模型的安全測試也是如此,很多方面的測試都還是空白,人們在使用一些對付傳統人工智能的手段來對AI大模型進行壓力測試,但這顯然是不夠的。

目前,行業將AI大模型的安全風險分為三個方向,分別是訓練數據、模型本身和使用場景。在訓練數據方面,數據采集不當、存在偏見或標簽錯誤、數據被投毒等都被視為安全風險;在模型本身,模型的可靠性、穩定性、魯棒性等都是測試項,同時企業也在關注模型被誤導性;然后在使用階段,主要防范欺詐、歧視、政治傾向等風險內容,以及用戶數據的保護。

表面上看,好像已經能夠覆蓋大模型各方面的風險,但是在目前的方案中,企業發現由于大模型處于野蠻生長的階段,很多問題都是未知的。于是乎,ChatGPT被發現存在大量具有攻擊性的行為。行業想到的辦法是用魔法打敗魔法——以AI對抗AI。

然而,魔高一尺還是道高一丈,這實際上也是不可控的。

今年3月份,一封千位大佬的聯名信呼吁,應該立即停止訓練比GPT-4更強大的AI系統,暫停期至少6個月。簽名的有圖靈獎得主Yoshua Bengio、Stability AI首席執行官Emad Mostaque、蘋果聯合創始人Steve Wozniak、紐約大學教授馬庫斯、馬斯克,以及《人類簡史》作者Yuval Noah Harari等。但此事似乎并沒有什么結論。

也就在日前,OpenAI公布了該公司在安全方面的舉措,實際上和谷歌等公司都是大同小異,且都說明對于AI大模型的防護也是需要不斷完善,通過實踐和研究來解決安全問題。

不難預見,新一輪AI大模型“競賽”開始了,安全和責任制措施當然也會升級,但模型和防護誰發展更快,相信更多人都傾向于相信前者發展更加野蠻。

結語

Gemini模型的發布標志著,全球AI大模型發展正式進入原生多模態時代,模型的各項性能和數據融合能力將顯著增強。在更廣泛的領域,AI大模型將取代人工,且比人工更加出色。不過,安全問題似乎并沒有被妥善解決,新一輪AI大模型競賽就直接開始了。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6168

    瀏覽量

    105372
  • Gemini
    +關注

    關注

    0

    文章

    53

    瀏覽量

    7593
收藏 人收藏

    評論

    相關推薦

    谷歌正式發布Gemini 2.0 性能提升近兩倍

    在智能體時代,谷歌再次引領技術潮流,正式發布了其最新力作——Gemini 2.0。這款AI模型不僅在性能上實現了顯著提升,更是在多模態表現和原生工具應用方面展現了前所未有的
    的頭像 發表于 12-12 14:22 ?268次閱讀

    谷歌發布Gemini 2.0 AI模型

    谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名為“深度研究”的新特性,旨在為用戶提供更加全面和深入的復雜主題探索與報告撰寫輔助。 Gemini 2.0通過高
    的頭像 發表于 12-12 10:13 ?217次閱讀

    谷歌計劃12月發布Gemini 2.0模型

    近日,有消息稱谷歌計劃在12月發布其下一代人工智能模型——Gemini 2.0。這一消息引發了業界的廣泛關注,因為谷歌在人工智能領域一直保持
    的頭像 發表于 10-29 11:02 ?461次閱讀

    OpenAI推出新模型CriticGPT,用GPT-4自我糾錯

    基于GPT-4模型——CriticGPT,這款模型專為捕獲ChatGPT代碼輸出中的錯誤而設計,其獨特的作用在于,讓人們能夠用GPT-4來查找GP
    的頭像 發表于 06-29 09:55 ?549次閱讀

    GPT-4人工智能模型預測公司未來盈利勝過人類分析師

    據悉,本次研究中,研究人員僅向GPT-4提供了匿名的財務數據,包括資產負債表和損益表,并要求其預測未來盈利增長。盡管未獲得其他信息,GPT-4仍能達到60%的準確度,遠超人類分析師的平均水平
    的頭像 發表于 05-27 16:41 ?595次閱讀

    OpenAI全新GPT-4o能力炸場!速度快/成本低,能讀懂人類情緒

    ”的意思。GPT-4o文本、推理、編碼能力達到GPT-4 Turbo水平,速度是上一代AI大模型GPT-4 Turbo的兩倍,但成本僅為
    的頭像 發表于 05-15 00:15 ?7829次閱讀

    阿里云正式發布通義千問2.5,中文性能全面趕超GPT-4 Turbo

    在通義大模型發布一周年之際,阿里云邁出了歷史性的一步。近日,阿里云正式發布通義千問2.5版本,其性能全面超越GPT-4 Turbo,榮登中文大模型
    的頭像 發表于 05-13 11:16 ?985次閱讀

    阿里云發布通義千問2.5大模型,多項能力超越GPT-4

    阿里云隆重推出了通義千問 2.5 版,宣稱其“技術進步,全面超越GPT-4”,尤其是在中文環境中的多種任務(如文本理解、文本生成、知識問答及生活建議、臨時聊天及對話以及安全風險評估)方面表現出色,超越了GPT-4
    的頭像 發表于 05-09 14:17 ?962次閱讀

    商湯科技發布5.0多模態大模型,綜合能力全面對標GPT-4 Turbo

    場景應用需求;升級“日日新SenseNova 5.0”大模型體系,綜合能力全面對標GPT-4 Turbo。 此外對于文生視頻徐立也表示商湯科技很快就會發布相關的平臺產品。 備受矚目的商湯科技“日日新SenseNova” 5.0多
    的頭像 發表于 04-24 16:49 ?1108次閱讀

    OpenAI推出Vision模型GPT-4 Turbo,融合文本與圖像理解

    據悉,此模型沿用GPT-4 Turbo系列特有的12.8萬token窗口規模及截至2023年12月的知識庫架構,其創新亮點則是強大的視覺理解功能。
    的頭像 發表于 04-10 10:49 ?407次閱讀

    微軟Copilot全面更新為OpenAI的GPT-4 Turbo模型

    起初,Copilot作為Bing Chat AI助手推出,初期采用GPT-3.5模型,隨后升級至GPT-4取得顯著進步,如今再次更新至性能卓越的GPT-4 Turbo
    的頭像 發表于 03-13 13:42 ?731次閱讀

    新火種AI|秒殺GPT-4,狙殺GPT-5,橫空出世的Claude 3振奮人心!

    GPT-4被拉下神壇, Claude 3很可能對GPT-4實現全方位的碾壓 。 Anthropic發布3個模型
    的頭像 發表于 03-06 22:22 ?646次閱讀
    新火種AI|秒殺<b class='flag-5'>GPT-4</b>,狙殺<b class='flag-5'>GPT</b>-5,橫空出世的Claude 3振奮人心!

    全球最強大模型易主,GPT-4被超越

    近日,AI領域的領軍企業Anthropic宣布推出全新的Claude 3系列模型,其中包括最強版Claude 3 Opus。據該公司稱,Claude 3系列在推理、數學、編碼、多語言理解和視覺方面全面超越了包括GPT-4在內的所
    的頭像 發表于 03-05 09:58 ?658次閱讀

    Anthropic推出Claude 3系列模型,全面超越GPT-4,樹立AI新標桿

    近日,AI領域的領軍企業Anthropic震撼發布了全新的Claude 3系列模型,該系列模型在多模態和語言能力等關鍵領域展現出卓越性能,成功擊敗了此前被廣泛認為是全球最強AI
    的頭像 發表于 03-05 09:49 ?687次閱讀

    全球最強大模型易主:GPT-4被超越,Claude 3系列嶄露頭角

    近日,人工智能領域迎來了一場革命性的突破。Anthropic公司發布了全新的Claude 3系列模型,該系列模型在多模態和語言能力等關鍵指標上展現出卓越性能,成功超越了此前被廣泛認為是全球最強
    的頭像 發表于 03-05 09:42 ?657次閱讀
    主站蜘蛛池模板: 国产人成午夜免视频网站| 69xxxxxxxxxhd日本| 亚洲精品第三页| 四虎影视免费| 高清性色生活片欧美在线| 国产亚洲综合视频| 69堂在线观看国产成人| 巨大欧美黑人xxxxbbbb| 色惰网站| 老师叫我揉她内裤越快越好| 全黄性色大片| 天天摸天天做天天爽天天弄 | 日本色频| 91高清在线成人免费观看| 国产亚洲papapa| 一级中文字幕乱码免费| 国模私拍福利一区二区| 国产1024一区二区你懂的| 亚洲黄色三级| 爱爱动态视频免费视频| 啪啪网站免费| 色偷偷888欧美精品久久久| 亚洲第一视频| 日本免费在线| 久久久夜色精品国产噜噜| 毛片污| 亚洲伊人精品综合在合线| 国产精品不卡片视频免费观看| 夜夜春夜夜爽| 日本精品卡一卡2卡3卡四卡三卡| 中日毛片| 成人免费看片视频色多多| free性欧美video69| 欧美日韩亚洲国内综合网俺| 女人成午夜大片7777在线| 亚洲大成色www永久网| 在线免费影视| 精品精品国产自在久久高清| 国产女主播在线| avtt天堂网 手机资源| 久久青草视频|