好看的电视剧,琅琊榜海宴小说,完结小说

來源：新智元編輯：Aeneas 昕朋

【導讀】2022年有哪些人工智能的突破？今天，李飛飛高徒Jim Fan盤點了年度十大AI亮點。

人工智能的爆炸正在扭曲我們的時間感。

你能相信Stable Diffusion只有4個月大，而ChatGPT的出現還不到一個月嗎？

打個形象的比喻，只要眨一下眼，你就會錯過一個全新的行業。

2022年的AI領域，大規模的生成模型像雨后春筍一樣地冒出，改變了整個AI界的格局。

而且，這些模型正在迅速走出實驗室，在現實中被應用。

比如，LLM技術就啟發了兩個新興的領域——決策代理（游戲、機器人等等）和 AI4Science。

李飛飛高徒Jim Fan為我們總結了2022年的十大AI高光時刻。讓我們把時間倒轉，看看2022年都有哪些令人驚嘆的AI突破。
一、文字-圖像生成

DALLE-2是第一個可以從任意標題生成逼真的高分辨率圖像的大規模擴散模型。

它啟動了AI的藝術革命，催生了許多新的應用程序、初創公司和思維方式。

但 DALLE-2被保護在OpenAI的圍墻后面，并沒有開源。

在OpenAI之后，LMU的StabilityAI和runwayml邁出了英勇的一步，基于「潛在擴散」算法訓練了他們自己的互聯網規模的text2image模型。他們稱該模型為「穩定擴散」，并開源了代碼和權值（weighs）。

事實證明，Stable Diffusion的開放性，讓它給游戲帶來了巨變。現在，許多初創公司和研究實驗室都在Stable Diffusion的基礎上創建新的應用程序，Stable Diffusion本身也被開源社區不斷改進。最近，Stable Diffusion已經達到了v2.1版本，可以在單個GPU上運行了。

另外，今年還有來自GoogleAI的兩個image2text模型。GoogleAI既沒有發布模型也沒有發布API，但從論文中，我們仍然可以看到不少有趣的見解。

Imagen

Parti

它是一個沒有diffusion的Transformer模型。

二、文字-文字生成大家都知道，我說的是ChatGPT!
這是歷史上唯一一個在5天內就獲得了100萬用戶的應用程序。ChatGPT也大大啟發了我們人類的創造力。

ChatGPT和GPT-3.5都使用了一種叫做RLHF（「從人類反饋中強化學習」）的新技術。

這也就意味著，提示工程或許很快就會消失了。

ChatGPT的流行，已經催生了一波新的創業公司和競爭者，比如Jasper Chat、YouChat、Replit的Ghostwriter chat，以及perplexity_ai。

這些競爭者提供了如此直觀的搜索方式，連谷歌的高管們都開始出汗了!

三、文本- 機器人模型如何給GPT提供胳膊和腿，讓它們能打掃你混亂的廚房？

與NLP不同，機器人模型需要與物理世界互動。

在今年，大的預訓練Transformer終于開始解決機器人領域最難的問題了!

VIMA

10月，我和同事創建了一個「機器人GPT 」——名為VIMA的tranformer。它可以接收任何混合的文本、圖像和視頻作為prompt，并輸出機器人手臂的控制。我們的模型被稱為VIMA（「VisuoMotor Attention」），已經完全開源了。現在，單個智能體已經能夠解決視覺目標、視頻的一次性模仿、新概念基礎、視覺約束等，具有了模型容量和數據的強大擴展性。

RT-1

沿著與VIMA類似的路徑，來自GoogleAI的研究人員發布了RT-1，這是一種在700項任務和130K的人類演示上訓練的機器人transformer。

這些數據是由13個機器人在17個月內收集的，是字面意義上的鋼鐵部隊！
四、文本 - 視頻本質上說，視頻就是隨著時間的推移捆綁在一起的一系列圖像，給我們創造了運動的錯覺。

如果我們可以做text2image，那為什么不在里面加上時間軸，來獲得額外的樂趣呢？

目前，文本 - 視頻領域有3個重大的工作，但沒有一個是開源的。

Make-A-Video

首先是Meta AI的Make-A-Video：不需要成對的文本-視頻數據，就可以得到文本-視頻的生成。

您可以在此處注冊試用訪問權限：https://makeavevideo.studio

論文鏈接：https://arxiv.org/abs/2209.14792

Imagen Video

Google AI的Imagen Video：它能使用擴散模型生成高清視頻，基于Imagen靜態圖像生成器。

Phenaki

來自谷歌AI的Phenaki: 從開放領域的文本描述中生成可變長度的視頻。

五、文本-3D建模從設計創新產品到在電影和游戲中創造奇妙的視覺效果，3D建模正成為文本-X生成模型的下一片藍海。令人驚喜的是，2022年出現了許多卓有前途的3D生成模型。在此，Fan列舉了3個模型。

DreamFusion

首先登場的，是Google AI研究團隊與UC Berkeley聯合開發的DreamFusion。

該模型使用二維文本到圖像的擴散模型來執行文本到三維的合成。

基于NeRF算法，DreamFusion可以通過給定文本生成3D模型。

該模型可以從任何角度查看，在任意照明下可以重新點亮，還可以合成到任何三維環境當中。

Magic3D

第二項成果，是英偉達AI團隊的兩個項目，名為GET3D和Magic3D。

GET3D論文鏈接：https://nv-tlabs.github.io/GET3D/assets/paper.pdf

Magic3D論文鏈接：https://arxiv.org/pdf/2211.10440.pdf

GET3D僅使用二維圖像進行訓練，可生成具有高保真紋理和復雜幾何細節的三維圖形。

該模型允許用戶立即將其形體導入3D渲染器和游戲引擎，以便進行后續編輯。

Magic3D與DreamFusion類似，使用文本到圖像模型生成2D圖像，然后優化為體積NeRF（神經輻射場）數據，將低分辨率生成的粗略模型優化為高分辨率的精細模型。

根據英偉達AI團隊，由此產生的Magic3D方法，可以比DreamFusion更快地生成3D目標。

Point-E

繼年初推出的DALL-E 2用天才畫筆驚艷所有人之后，周二OpenAI發布了最新的圖像生成模型「POINT-E」，它可通過文本直接生成3D模型。

相比競爭對手們（如谷歌的DreamFusion）需要幾個GPU工作數個小時，POINT-E只需單個GPU便可在幾分鐘內生成3D圖像。

根據測試，Prompt輸入后POINT-E基本可以秒出3D圖像，此外輸出圖像還支持自定義編輯、保存等功能。
六、會玩《我的世界》的AI

《我的世界》是一款測試AI通用智能的絕佳游戲。首先，它是一款無限開放的沙盒游戲，極度體現玩家的創造力。

其次，該游戲有1.4億的玩家群體，是英國總人口的兩倍。用戶基礎如此龐大，供AI學習的游戲數據可謂是源源不絕。

那么，AI能否和人類一樣盡情揮灑想象力呢？

Jim Fan和同事合作開發了第一個玩《我的世界》的AI「MineDojo」，它可以在自然語言提示下解決許多任務。

Fan的最終目標是建立一個「具身的ChatGPT」。目前，MineDojo平臺已經完全開源。

與此同時，Jeff Clune的團隊宣布了一個名為視頻預訓練（VPT）的模型，該模型可以直接輸出鍵盤和鼠標的動作。

VPT擁有更廣闊的視野，但不受語言條件的限制。在這點上，MineDojo和VPT恰好相輔相成。

七、AI外交官Meta AI推出的CICERO是第一個在《外交》游戲中實現人類水平表現的人工智能智能體。

《外交》是一款七人制經典策略游戲，可以說是棋盤游戲Risk、紙牌游戲撲克和電視節目Survivor的結合。該游戲需要廣泛的自然語言協商才能與人類合作和競爭。然而，CICERO的出現表明，人工智能現在已經有說服他人和虛張聲勢的能力。

目前，DeepMind也宣布開發自己的外交官AI智能體。那么，如果CICERO使用這個AI模型，又會發生什么呢？
八、音頻-文本模型Whisper是OpenAI發布的一個大型開源語音識別模型，在英語語音識別方面有接近人類水平的魯棒性和準確性。

Whisper經過了來自網絡的680，000小時音頻數據的訓練。Open AI強調，Whisper的語音識別能力已達到人類水準。

Open AI將Whisper開源，是否是為了解鎖更多文本token，用以訓練萬眾矚目的GPT-4呢？
九、核聚變DeepMind與瑞士洛桑聯邦理工學院（EPFL）聯合開發了第一個核聚變相關的深度強化學習系統，可以保持核聚變等離子體在托卡馬克內的穩定。

論文鏈接：https://www.nature.com/articles/s41586-021-04301-9

同樣在本月，美國能源部宣布了一項巨大的突破：人類首次實現了核聚變反應的凈能量增益！

這是人類首次實現這一里程碑。這一生，我們或許會成為聚變文明！
十、應用于生物學的Transformer2021年，AlphaFold開啟了語言模型預測蛋白質3D結構的序幕。

7月，DeepMind宣布了「蛋白質宇宙」——將AlphaFold的蛋白質數據庫擴展到2億個結構！

此外，英偉達AI研究團隊還拓展了BioNeMo大型語言模型的框架，以幫助生物技術公司和研究人員生成、預測和理解生物分子數據。

以上便是Jim Fan對2022年十大AI亮點的盤點。當然，Fan也表示，還有無數令人興奮的作品為人工智能的進步做出了貢獻。

每篇論文都是AI大廈里的一磚一瓦，所有的努力都應該慶祝。

不過，Fan在最后也強調，隨著人工智能系統變得越來越強大，我們必須意識到潛在的危險和風險，并采取措施減輕它們。

無論是通過仔細的培訓設計、適當的監督還是全新的保障方法，人工智能的安全與倫理成為越來越的AI專家所討論的議程。

毫無疑問，2022年是充滿奇跡的一年，也是令人驚嘆的一年。未來一年又會有什么震驚世界的突破？我們與你一起關注。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

AI

AI

+關注

關注
87

文章
31493

瀏覽量
270049
人工智能

人工智能

+關注

關注
1796

文章
47643

瀏覽量
239861

年度電解槽十大品牌+年度制氫十大供應商，穩石氫能榮獲兩大獎項！

此前，2024年10月16日，由國能網與國能能源研究院聯合舉辦的第九屆新能源行業品牌盛典(GPBC)圓滿召開，穩石氫能榮獲2024年度·氫能行業品牌榜“年度電解槽十大品牌”與“年度制氫

發表于 01-24 14:53 ?50次閱讀

東軟三家客戶入選2024年度推進醫改服務百姓健康十大新舉措

近日，由國家衛生健康委體制改革司指導，經專家篩選評審會議審議通過，《中國衛生》雜志社、健康報社公布2024年度“推進醫改服務百姓健康十大新舉措、十大改革先鋒”推介結果。其中，東軟參與建設的安徽蕪湖會診轉診中心、天津濱海新區緊密型

發表于 01-14 14:46 ?234次閱讀

比亞迪海豹榮獲日本年度風云車十大最佳車型獎

近日，比亞迪海豹憑借卓越表現，榮獲2024-2025日本年度風云車“十大最佳車型”獎。這一獎項由“日本年度風云車評選委員會”主辦，旨在表彰年度最受關注的

發表于 12-17 13:50 ?202次閱讀

敦泰榮獲車載顯示年度十大知名品牌

由亞洲新能源汽車網發起的“2024中國智能座艙行業十大品牌”評選活動在中國汽車重鎮——山城重慶正式揭曉結果。敦泰成功榮獲“車載顯示年度十大知名品牌”榮譽表彰。

發表于 12-16 10:19 ?238次閱讀

全國產PSM高壓電源控制系統，助力核聚變技術發展

面對日益加劇的能源消耗問題，核聚變作為一種具有巨大潛力的清潔能源，其研究與開發的重要性日益凸顯。高壓脈沖電源在核聚變反應中發揮著重要作用，它必須具備高電壓、強電流、快速響應和精準控制等特性，以適應

發表于 09-18 10:40 ?577次閱讀

全國產PSM高壓電源控制系統，助力<b class='flag-5'>核聚變</b>技術發展

可控核聚變解決方案

聚變是兩個輕原子核聚合，生成新的更重原子核的過程，其反應釋放的能量巨大。因該過程同太陽的發光發熱過程一致，可控核聚變又稱為人造太陽。其憑借資源無限、環境友好等優勢，被譽為人類能源的終極解決方案。我國

發表于 09-05 10:32 ?1次下載

解決方案丨持續注能人造太陽裝置，助力我國可控核聚變技術研究

核聚變是兩個輕原子核聚合，生成新的更重原子核的過程，其反應釋放的能量巨大。因該過程同太陽的發光發熱過程一致，可控核聚變又稱為人造太陽。其憑借資源無限、環境友好等優勢?，被譽為人類能源的終極解決方案

發表于 08-30 16:37 ?603次閱讀

解決方案丨持續注能人造太陽裝置，助力我國可控<b class='flag-5'>核聚變</b>技術研究

解決方案丨持續注能人造太陽裝置，助力我國可控核聚變技術研究

可控核聚變技術和原理是氘氚原子聚變形成氦原子釋放大量的能量，該過程同太陽的發光發熱過程一致，因此可控核聚變又稱為人造太陽。因其具有資源無限、環境友好等特點，被譽為人類能源的終極解決方案。我國在

發表于 08-28 18:20 ?369次閱讀

業務資訊丨森木磊石持續發力加速器、核聚變；PPEC電源控制核心走入高校課堂

粒子加速器和核聚變是當今科學研究和能源開發領域的重要方向，具有巨大的發展潛力和廣泛的應用前景。粒子加速器作為提高粒子能量的重要工具，廣泛應用于醫療、輻照加工、環保、無損檢測等領域。而核聚變是一種模擬

發表于 07-27 08:23 ?539次閱讀

AI浪潮下的十大消費者新趨勢

人工智能已經風靡全球，當我們沉浸在AI技術為辦公與生活帶來的各種便利時，一些人也會質疑：AI 真的能為我們描繪出更美好的未來畫卷嗎？ AI 賦能的十大消費者趨勢愛立信消費者實驗室的最

發表于 06-05 10:30 ?384次閱讀

度亙核芯榮獲“2023年度中國十大光學產業技術”獎

5月18日，由光電匯主辦的“2023年中國十大光學產業技術”年度評選頒獎典禮于武漢光谷科技會展中心隆重召開。經專家評審、網絡投票等嚴格評選，度亙核芯“用于車載激光雷達的940nm芯片與光纖模塊”在一

發表于 05-23 08:28 ?654次閱讀

新火種AI|AI教母李飛飛初創AI公司，開啟最前沿AI算法研究

AI教母李飛飛首次創業，瞄準“空間智能”。

發表于 05-06 16:24 ?337次閱讀

韓國“人造太陽”在核聚變研究中取得重大突破

這一進展是邁向實現近乎無限清潔能源的關鍵一步。科研人員數十年來致力于借助核聚變實現人類無限能源需求，該技術模擬了恒星內部的能量產生過程。核聚變通過高壓、高溫條件下使氫原子轉化為氦原子，從而釋放能量。

發表于 04-15 10:39 ?669次閱讀

科學家利用AI預測核聚變反應堆裂變模式，避免重啟反應堆

解決核聚變反應中過熱等離子體不可預測性問題，是實現穩定電力產出的最大瓶頸之一。近期，美國普林斯頓等離子體物理實驗室（簡稱 PPPL）取得重要進展，已經成功研發新型AI系統，可提前300毫秒預測聚變中等離子體的“撕裂”行為

發表于 02-28 16:08 ?864次閱讀

核電站工作原理核電站是核聚變還是核裂變

核電站是通過核裂變反應來工作的。核裂變是指重核如鈾、钚等核素被中子撞擊后裂變成兩個或多個較輕的核片，同時釋放出大量的能量。而核聚變則是指兩個輕核聚變成重核的過程。目前，核能發電主要依靠的是核裂變

發表于 02-02 16:27 ?1921次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史