OpenAI首個文生視頻模型Sora炸街!整個視頻行業(yè)飯碗要被端了?業(yè)內(nèi)人士:為時尚早
2月16日凌晨,OpenAI發(fā)布了首個文生視頻模型Sora,可以用文字指令生成長達1分鐘的高清視頻。
當前大模型在各個領(lǐng)域的應(yīng)用,主要集中在文生文、文生圖之上,而在文生視頻領(lǐng)域卻進步緩慢。此次文生視頻模型Sora的發(fā)布,無疑令人振奮。不少業(yè)內(nèi)分析指出,這將對于廣告業(yè)、電影預(yù)告片、短視頻行業(yè)帶來巨大的顛覆。但也有從業(yè)者保持冷靜:短期內(nèi)的顛覆速度不一定那么快,更多地是借助新技術(shù),激發(fā)更多人的創(chuàng)作力。
▍短期內(nèi)較難帶來顛覆性影響
在官網(wǎng)上已經(jīng)更新了48個視頻實例中,Sora能夠準確呈現(xiàn)視頻細節(jié),還能深刻理解物體在現(xiàn)實世界中的存在狀態(tài),并生成具有豐富情感的角色。
例如,某個Prompt(大語言模型的提示詞)的描述是美麗、白雪皚皚的東京城市熙熙攘攘。鏡頭穿過熙熙攘攘的城市街道,跟隨幾個人享受美麗的雪天,在附近的攤位上購物。絢麗的櫻花花瓣和雪花一起在風(fēng)中飛舞。
在Sora生成的視頻里,鏡頭從俯視白雪覆蓋的東京,慢慢推進到兩個行人在街道上手牽手行走,街旁的櫻花樹和攤位的畫面均細致呈現(xiàn)。
不少業(yè)內(nèi)人士認為,這個進展的意義難以想象,將對電影、小說、動漫、教育、游戲、自媒體行業(yè)全部具有深遠的影響。
但也有視頻剪輯從業(yè)人員破冷水:“大規(guī)模應(yīng)用后能否催生更多好作品不清楚,但制造視頻垃圾的速度一定會指數(shù)級增長。”
前百度產(chǎn)品委員會主席宋健表示:Sora確實很牛,但如果認為三年后就沒人拍視頻了,抖音Tiktok會被很快顛覆,那還是為時過早。
“從平臺的角度,抖快視頻號本質(zhì)上還是以視頻為載體的社交平臺,特效甚至視頻化本身只是個形式。做產(chǎn)品的肯定知道從零建一個社交平臺到底有多難,需要天時地利人和,技術(shù)只是其中的變量之一。此外,生成式視頻的信息量不如真實拍攝大。比如一個30歲的男人和一個20歲的女人對話,表達、語氣、表情的背后都是他們積累了50年的數(shù)據(jù)總和。這些是生成式AI當前無法替代的。而且用戶對這些細節(jié)很敏感。”
宋健認為,如若希望借助Sora這種視頻生成式技術(shù),把視頻行業(yè)變成一個“人純粹消費機器工業(yè)化內(nèi)容”的局面,這恐怕沒戲。但如果說,通過借助新技術(shù),讓人和人之間產(chǎn)生新的連接,激活新的創(chuàng)作產(chǎn)能,這是有戲的。但也得尊重行業(yè)規(guī)律,日拱一卒地通過“技術(shù)”迭代“生態(tài)”,而不是直接把技術(shù)強懟給用戶。
▍有望縮短實現(xiàn)通用人工智能的時間
360集團創(chuàng)始人周鴻祎也表示,今天Sora可能給廣告業(yè)、電影預(yù)告片、短視頻行業(yè)帶來巨大的顛覆,但速度不一定那么快。
“AI不一定那么快顛覆所有行業(yè),但它能激發(fā)更多人的創(chuàng)作力。很多人談到Sora對影視工業(yè)的打擊,我倒不覺得是這樣,因為機器能生產(chǎn)一個好視頻,但視頻的主題、腳本和分鏡頭策劃、臺詞的配合,都需要人的創(chuàng)意至少需要人給提示詞。一個視頻或者電影是由無數(shù)個60秒組成的。今天Sora可能給廣告業(yè)、電影預(yù)告片、短視頻行業(yè)帶來巨大的顛覆,但它不一定那么快擊敗TikTok,更可能成為TikTok的創(chuàng)作工具。”
周鴻祎認為,大語言模型的厲害之處在于,能完整地理解這個世界的知識。而此前所有的文生圖、文生視頻都是在2D平面上對圖形元素進行操作,并沒有適用物理定律。
“這次很多人從技術(shù)上、從產(chǎn)品體驗上分析Sora,強調(diào)它能輸出60秒視頻,保持多鏡頭的一致性,模擬自然世界和物理規(guī)律,實際這些都比較表象。最重要的是Sora的技術(shù)思路完全不一樣。Sora產(chǎn)生的視頻里,它能像人一樣理解坦克是有巨大沖擊力的,坦克能撞毀汽車,而不會出現(xiàn)汽車撞毀坦克這樣的情況。”
周鴻祎認為,這也代表未來的方向。有強勁的大模型做底子,基于對人類語言的理解,對人類知識和世界模型的了解,再疊加很多其他的技術(shù),就可以創(chuàng)造各個領(lǐng)域的超級工具。
“比如生物醫(yī)學(xué)蛋白質(zhì)和基因研究,包括物理、化學(xué)、數(shù)學(xué)的學(xué)科研究上,大模型都會發(fā)揮作用。這次Sora對物理世界的模擬,至少將會對機器人具身智能和自動駕駛帶來巨大的影響。原來的自動駕駛技術(shù)過度強調(diào)感知層面,而沒有工作在認知層面。其實人在駕駛汽車的時候,很多判斷是基于對這個世界的理解。比如對方的速度怎么樣,能否發(fā)生碰撞,碰撞嚴重性如何,如果沒有對世界的理解就很難做出一個真正的無人駕駛。”
周鴻祎預(yù)測,Sora的出現(xiàn),或意味著AGI(通用人工智能)實現(xiàn)將從10年縮短到1年。
“OpenAI訓(xùn)練這個模型應(yīng)該會閱讀大量視頻。一旦人工智能接上攝像頭,把所有的電影都看一遍,把YouTube上和TikTok的視頻都看一遍,對世界的理解將遠遠超過文字學(xué)習(xí),一幅圖勝過千言萬語,而視頻傳遞的信息量又遠遠超過一幅圖,這就離AGI真的就不遠了,不是10年20年的問題,可能一兩年很快就可以實現(xiàn)。
▍多模態(tài)大模型將成為生成式AI的重點發(fā)展方向
隨著文生圖、圖片對話技術(shù)的成熟,文生視頻已成為多模態(tài)大模型下一步發(fā)展的重點。展望2024年,機構(gòu)人士認為,大模型領(lǐng)域的競爭將進一步白熱化,多模態(tài)大模型將成為生成式AI的重點發(fā)展方向,并有望推動本輪AI行情進一步擴散。
在國盛證券看來,AI文生視頻是多模態(tài)應(yīng)用的下一站。文生視頻即根據(jù)給定的文字提示直接生成視頻。隨著文生視頻技術(shù)的日趨成熟和廣泛應(yīng)用,或?qū)楫斚聼衢T的短劇市場帶來變數(shù)。該技術(shù)有望極大降低短劇制作的綜合成本,為解決“重制作而輕創(chuàng)作”的共性問題提供解決方案,短劇制作的重心有望回歸高質(zhì)量劇本創(chuàng)作。
中信證券表示,多模態(tài)大模型算法的突破將帶來自動駕駛、機器人等技術(shù)的革命性進步,持續(xù)看好本輪生成式AI浪潮對科技產(chǎn)業(yè)的長周期影響和改變,繼續(xù)關(guān)注算力、算法、數(shù)據(jù)、應(yīng)用等環(huán)節(jié)的領(lǐng)先廠商。
東吳證券判斷,多模態(tài)是AI商業(yè)宏圖的起點,有望真正為企業(yè)降本增效,且企業(yè)可將節(jié)省下來的成本用于提高產(chǎn)品、服務(wù)質(zhì)量或者技術(shù)創(chuàng)新,推動生產(chǎn)力進一步提升;同時,也可能出現(xiàn)新的、空間更大的用戶生成內(nèi)容平臺。
本文源自財聯(lián)社
- 故障碼2E9F(意味著什么?如何解決?)09-08
- 1空調(diào)繼電器壞了出現(xiàn)什么問題(如何判斷及更換)
- 2大金冷氣故障代碼a3(大金冷氣故障代碼A3解析指南)
- 3凱福將指紋鎖售后服務(wù)中心(凱福指紋鎖服務(wù)中心:專業(yè)售后服務(wù)一站解決)
- 4樂開指紋鎖售后電話(樂開指紋鎖售后電話:快速與貼心的服務(wù)!)
- 5步陽防盜門打不開怎么辦(步陽防盜門無法開啟應(yīng)對策略)
- 6創(chuàng)維G6圖像模式怎么調(diào)(創(chuàng)維G6圖像模式指南:如何實現(xiàn)最佳中心調(diào)節(jié)?)
- 7奧克斯柜機空調(diào)故障代碼e4(奧克斯柜機空調(diào)故障代碼e4:疑難排解及解決方案
- 8小米電視換屏幕多少錢(維修費用詳解)
- 9西門子洗衣機報e17故障(西門子洗衣機E17故障解決方案)
- 10十大不建議買的燃氣灶排名(哪些品牌不靠譜?)
-
四預(yù)警生效中!北京城區(qū)雨量已達中到大雨,下午雨勢加強,局地暴雨
2025-06-14
-
NBA總決賽MVP榜:哈利伯頓力壓亞歷山大升至榜首
2025-06-13
-
2025 世俱杯小組賽巡禮 & 關(guān)鍵榜單速覽
2025-06-13
-
@高校畢業(yè)生 這些就業(yè)創(chuàng)業(yè)的政策補貼請知曉
2025-06-12
-
AI幫忙填報高考志愿靠譜嗎?夸克、知乎等相繼上線高考服務(wù)
2025-06-12


