在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Sora到底牛在哪 | AI爆發的大趨勢下,普通人真正該學的是什么

王嵐 ? 來源:jf_23355247 ? 作者:jf_23355247 ? 2024-03-06 22:46 ? 次閱讀

Sora炸裂了的地方,在于它能理解自然語言,知道那個畫面該是怎么樣的,它學習很多視頻內容(大力出奇跡,需要很多算力),而且一上來就是能制作60s的視頻,剛好是短視頻的需求,之前的AI視頻生成的時間都很短(幾秒鐘).

就說Sora有多火吧,生成的視頻上線一個,瘋傳一個。

明顯能看出來Sora生成的視頻中的各項細節都讓人驚嘆,一如去年的ChatGPT,Sora被認為是AGI(通用人工智能)的又一個里程碑時刻。

一.sora的出現可以如何看待:

對于許多行業來說,都應該關注Open AI和sora這些人工智能相關的產品

尤其是對設計領域來說,比如以前做logo、做海報、宣傳冊、做操作視頻剪輯、拍攝等等相關的行業。

其一是思考,面對這些新技術、新工具,對自己有哪些挑戰,應對策略是什么。

其二是結合,基于自己當前的業務,哪些可以利用這些技術進行結合,從而提升自己的效率和業務場景。

比如美圖秀秀、稿定設計、剪映等產品,就基于AI立馬推出了相關的產品。

(PS:目前 openai 官方還未開放 sora 灰度,不過根據文生圖模型 DALL·E 案例,一定是先給 ChatGPT Plus 付費用戶使用,需要注冊或者升級 GPT Plus 可以看這個教程:升級 ChatGPT Plus 的教程,一分鐘完成升級)

二. 以終為始地看,AI爆發的大趨勢下,普通人真正該學的是什么?

我覺得有三點:講故事的能力、結構化思考力和內容專業力。

1. 講故事的能力

以文生視頻為例,先不說Sora,很多人連Pika、Runway都用不利索。

用文字描述一件事、一個觀點、一個訴求并不難,但描述一段畫面、一個場景、一則完整故事,對絕大多數人是極高的門檻。

Sora不會讓影視行業失業,正相反,如果視頻生成的AI技術持續普及,會讓真正會寫故事的人發揮才能,而不是受限于影視行業的潛規則而灰心放棄。

2. 結構化思考力

很多寫Sora的文章,都在講它在模型算法、算力涌現、物理模擬上的創新。對我而言,會更驚訝它在訓練視頻數據時,以一種結構化提示詞方法,解決了視頻標注問題:

“We first train a highly descriptive captioner model and then use it to produce text captions for all videos in our training set”

本質上看,無論是B端訓練數據,還是C端和大模型對話,都用到了結構化表達能力。包括那些所謂“Sora培訓”,其實教你的也是怎么寫好提示詞。舉個例子,對這樣的場景:

該怎么描述呢?一個在沉思的老爺爺?一個戴眼鏡的老爺爺?一個在咖啡廳發呆的老爺爺?可能大部分人想到這兒就結束了。但更加結構化的描述可以是:

主體人物::一位 60 多歲留著胡須的白發老人

鏡頭景別:臉部特寫

背景環境:巴黎的一家咖啡館

人物狀態:注視著窗外行走的人們,一動不動陷入沉思,后又抿嘴微微一笑

人物細節:穿著一件羊毛大衣和一件紐扣襯衫、頭戴棕色貝雷帽,戴著眼鏡,像是個教授

環境細節:金色的燈光和背景中的巴黎街道和城市

鏡頭技術:景深、35 毫米電影膠片,有電影感

具備寫出上述提示詞的能力,才能真正發揮多模態技術的價值。這背后蘊含著的,就是結構化總結和思考能力。

有句話很形象,寫提示詞就像客戶講brief,能把需求說清楚,就離正確答案不遠了。

3. 內容專業力

這點又說回到創作者本身,我比較喜歡楊遠騁老師(「躺島」和「新世相」聯合創始人)的一個觀點:

最大的影響會是出現新的創作者,會出現完全不在人們視野里的新的內容偶像,他們有非常好的品位、思維方式和世界觀,但受限于表達技術,在過去卻連基本的視頻制作能力都不具備。

Koji,公眾號:十字路口CrossingSora 喧囂過后,理性浮現 | 我問出了這 5 位頂級創作者的真實想法

是的,除了上文提到的講故事能力。如果你具備對“好內容”的理解力,懂得怎樣更合理地設計腳本、做分鏡、上特效、畫故事板、運鏡、調度、選角、布景、調光、配音、后期等等,AI就是你發揮想象力最好的幫手。能用好 AI 的人,一定能做出更好作品、獲得更多收入。

因此我堅定地認為,這波AI趨勢,對高潛力的作家、畫手、設計師、編劇等創作者,是絕對的利好。如果你也想從中獲益,先把“創作一部好內容”作為目標學起來吧。

總的來講,我認為圍著Sora去追新聞沒啥必要。能跳出對Sora本身鋪天蓋地的宣傳,去思考這背后該真正掌握的技能是什么。用結構化思維去訓練講故事的能力,成為一名優秀創作者,才是值得為此付出時間的。

三、sora原理常見問題及解答:

Q:訓練數據的一個 clip 中如果有場景/鏡頭的切換,那 casual 3D CNN 還是會和過往的幀都有關系嗎?

A:訓練數據中大概率是有:一個 clip 有鏡頭/場景的切換。如果有切換,那么使用 casual 3D CNN 可能會帶來問題:在切換前后的內容是不同的,不僅會增加模型訓練難度,也會帶來瑕疵。這個可能就直接訓練了,通過相應數據的訓練就能解決。


Q:訓練數據的來源?

A:大家猜測有 1)youtube 的視頻。2)Shutterstock,之前有公告:Shutterstock 擴大與 OpenAI 的合作伙伴關系,簽署新的六年協議以提供高質量的訓練數據:渲染引擎的數據,這個網絡上大家貼出了一些間接證據。渲染引擎的數據能夠針對性地模擬出很多符合 3D 一致性、物理一致性的數據,對于模型的訓練應該有很好的幫助。


Q:輸出變長的長度、分辨率和長寬比是如何做到的?

A:1. diffusion 過程中,輸入的 noise tokens 就添加 factorized positional embedding。比如最直接的實現方式,每個 token 對應有三個數字(t, h, w)分別表示時間、長和寬,然后添加相應的 position embedding 去區分。

訓練的時候也采用了變長的長度、分辨率和長寬比。這些 examples 模型在訓練的時候見過。

這樣,可以做到技術報告中提到的:At inference time, we can control the size of generated videos by arranging randomly-initialized patches in an appropriately-sized grid。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31292

    瀏覽量

    269644
  • ChatGPT
    +關注

    關注

    29

    文章

    1564

    瀏覽量

    7863
  • Sora
    +關注

    關注

    0

    文章

    82

    瀏覽量

    230
收藏 人收藏

    評論

    相關推薦

    華為發布2025數據中心能源十大趨勢

    今日,華為舉辦2025數據中心能源十大趨勢發布會,華為數據中心能源領域總裁堯權全面解讀數據中心能源十大趨勢,為AI時代數據中心產業發展注入新動力,洞見變革,引領產業跨越式發展。
    的頭像 發表于 01-14 10:24 ?81次閱讀

    OpenAI推出AI視頻生成模型Sora

    近日,備受期待的OpenAI再次推出了其創新之作——AI視頻生成模型Sora。這一新品的發布,無疑為AI技術注入了新的活力。 據悉,Sora與OpenAI旗下的
    的頭像 發表于 12-12 09:40 ?224次閱讀

    智慧燈桿到底“智慧”在哪里?條形智能為您專業解讀 AI燈桿屏

    智慧燈桿到底“智慧”在哪里?條形智能為您專業解讀 AI燈桿屏
    的頭像 發表于 11-14 13:51 ?229次閱讀
    智慧燈桿<b class='flag-5'>到底</b>“智慧”<b class='flag-5'>在哪</b>里?條形智能為您專業解讀 <b class='flag-5'>AI</b>燈桿屏

    Sora還在PPT階段,“中國版Sora”已經開放使用了!

    電子發燒友網報道(文/梁浩斌)今年春節期間,OpenAI的AI文字生成視頻模型Sora驚艷全世界,極高的視頻生成效果、長達60秒的視頻生成長度,讓過去Pika Labs推出的Pika 1.0、去年
    的頭像 發表于 06-17 09:07 ?3455次閱讀

    AI浪潮的十大消費者新趨勢

    《2030年代十大熱門消費趨勢——AI賦能的未來》 收集了來自全球13座城市6,500名早期采用者對2030年代AI場景的反饋,并將其總結為了十大趨勢: ? 01?
    發表于 06-05 10:30 ?375次閱讀

    智譜AI劉江:5-10年內AGI會達到普通人水平

    在2024亞馬遜云科技中國峰會上,智譜AI首席生態官劉江發表了引人注目的觀點。他預測,在未來的5至10年內,AGI(通用人工智能)的發展將達到普通人的水平,這將是“我們這一代人遇到的最大的技術突破”。
    的頭像 發表于 05-31 10:33 ?762次閱讀

    智譜AI正研發對標Sora的國產文生視頻模型

    智譜AI,這家國內估值超過200億的AI大模型獨角獸企業,正全力投入研發一款與OpenAI的Sora相媲美的國產文生視頻模型。據公司內部人士透露,該模型預計最快將在今年內發布,將成為AI
    的頭像 發表于 05-07 09:22 ?546次閱讀

    基站式無人機屏蔽器對普通人有威脅嗎?

    式無人機屏蔽器應運而生。 那么,這種看似神秘的設備對普通人是否有威脅呢?今天,深圳市特信電子有限公司就來揭開它的神秘面紗。
    的頭像 發表于 04-08 09:10 ?684次閱讀

    新火種AI|圍攻光明頂:Sora效應AI視頻生成競賽

    Sora的出現,讓AI視頻生成領域真正“活”了起來
    的頭像 發表于 03-16 11:12 ?662次閱讀

    智能硬件 | AI PC新市場,英特爾、高通、AMD、蘋果誰能拔得頭籌?

    我們普通人和大模型的距離有多遠?AI發展到2024年,已經附著在各種智能硬件上了,什么AI PC,AI手機,AI藍牙音箱,
    的頭像 發表于 03-05 15:51 ?594次閱讀
    智能硬件 | <b class='flag-5'>AI</b> PC新市場,英特爾、高通、AMD、蘋果誰能拔得頭籌?

    湯姆貓加速布局AI應用,接入OpenAI Sora模型,探索生成視頻素材之道

    湯姆貓稱,Sora是人工智能不斷演進的里程碑之作。類似Sora的各類AI工具能夠助其以更高效率、更低成本創建豐富多樣且用戶體驗佳的AI應用產品和服務。
    的頭像 發表于 03-04 13:46 ?730次閱讀

    面對Sora,中國AI可以不急不躁不焦慮

    AISora
    腦極體
    發布于 :2024年02月23日 00:51:52

    探索OpenAI Sora視頻AI生成技術及其應用如何使用指南

    OpenAI的Sora現已擴展其能力范圍,進入視頻生成領域,標志著人工智能技術在多媒體內容創作上的一個重大突破。Sora的視頻AI功能使得用戶能夠根據文本描述自動生成高質量的視頻內容,這項技術
    的頭像 發表于 02-20 12:01 ?1476次閱讀

    openai sora如何使用?Sora 使用指南:快速上手

    OpenAI Sora 使用指南:快速上手 歡迎使用OpenAI Sora,一款強大的人工智能視頻生成工具。無論您是視頻制作新手還是專業人士,本指南將幫助您快速掌握Sora,輕松創作出高質量的視頻
    的頭像 發表于 02-20 11:19 ?4374次閱讀

    Sora到底懂不懂物理世界? Sora開啟更多可能

    OpenAI的視頻生成模型Sora持續引發關注,而圍繞Sora到底懂不懂物理世界?這個討論越發火熱,甚至是在討論Sora 到底是不是物理引擎
    的頭像 發表于 02-20 11:08 ?712次閱讀
    主站蜘蛛池模板: 亚洲瑟瑟网| 天堂成人| 天堂中文在线www| 综合伊人久久| 91国内在线| 插插好爽爽爽| 5151hh四虎国产精品| xxxx日本黄色| 狠狠色噜噜狠狠狠97影音先锋| 久色中文| 婷婷色在线观看| 欧美午夜片| 亚洲欧美高清| 四虎免费影院在线播放| 日韩a毛片| 四只虎免费永久观看| 日本免费三级网站| 精品一区二区视频| 俺去啦网婷婷| 天天爱天天做天天爽夜夜揉| 久久天天操| tube4欧美最新69| 在线免费观看黄色小视频| 特黄一级黄色片| 久久综合97色综合网| 一级视频在线| 国产自在自线午夜精品视频在| 好大好硬好深好爽视频h| 免费精品99久久国产综合精品 | 一级一片一a一片| 激情五月激情综合网| 一日本道加勒比高清一二三| 国产农村乱色xxxx| 国产高清在线精品一区| 午夜免费网址| 亚洲国产精品婷婷久久| 欧美伦理影院| 一区二区三区午夜| 1024手机看片日韩| 亚洲综合色一区二区三区小说| 欧美日韩亚洲国产|