從AI作畫到AI做視頻，這一跳改變了什么？

前沿科技 3年前 (2022) 虛像

圖片來(lái)源 @視覺(jué)中國(guó)

文｜腦極體

九月初的時(shí)候，AI 繪畫作品《太空歌劇院》在美國(guó)獲得了人類藝術(shù)競(jìng)賽一等獎(jiǎng)的新聞讓許多人震驚不已。學(xué)多人沒(méi)有想到，畫沙雕圖的 AI 竟然這么快就技能進(jìn)步到超越了人類。AI 作畫的時(shí)間從年初以小時(shí)為單位到現(xiàn)在短到秒級(jí)別，并且繪出的圖像質(zhì)量越來(lái)越高，幾乎接近人類專業(yè)畫家的水平。我們?cè)谏缃幻襟w中也看到越來(lái)越多的人分享他們?cè)诟鞣N AI 作畫平臺(tái)上的作品。

AI 作畫的風(fēng)頭正盛，用 AI 做視頻的應(yīng)用也悄然而至。九月底 Meta 小扎公布了自家 Make-A-Video 的 AI 視頻制作工具。這款工具可以生成高質(zhì)量的短視頻。Meta AI 做視頻的新聞還沒(méi)有焐熱，谷歌也不甘示弱，推出了兩款 AI 生成視頻的工具：Imagen Video 和 Phenaki。前者傾向于打造視頻質(zhì)量，后者傾向于視頻的邏輯與時(shí)長(zhǎng)。這幾款 AI 視頻制作工具各有特色。

文本生成圖像的 AI 技術(shù)大火才不過(guò)幾個(gè)月，就直接躍升至文本生成動(dòng)態(tài)視頻。從畫圖到做視頻，AI 的發(fā)展速度令人訝異，同時(shí)令人對(duì)未來(lái)的數(shù)字媒體憧憬。那么，這種跨越到底會(huì)給未來(lái)帶來(lái)什么呢？

AI 做視頻是 AI 作圖的延伸

在討論 AI 生成視頻會(huì)給未來(lái)帶來(lái)哪些改變前，我們先梳理下，AI 生成視頻的技術(shù)原理和應(yīng)用場(chǎng)景。

先從 Meta 家的 Make-A-Video 看起。在小扎公布的視頻中，我們可以看到一場(chǎng) AI 制作的視頻秀，其中一幕是泰迪熊正在畫自畫像。僅僅通過(guò)文本描述，Make-A-Video 就可以生成一段視頻。官網(wǎng)的案例中，我們會(huì)發(fā)現(xiàn)還有一些會(huì)飛的超人狗狗、喝水的馬等，這些視頻都是由 AI 生成的。

谷歌的 Phenaki 工具也類似 Make-A-Video，可以通過(guò)一系列的文本提示生成有故事性的連貫視頻。如官網(wǎng)展示的騎馬太空人、游泳的小熊等。

從 AI 作畫到 AI 制作視頻，靜態(tài)的圖像創(chuàng)作又轉(zhuǎn)化為動(dòng)態(tài)的視頻演繹一些簡(jiǎn)單的情節(jié)片段，這些是如何依靠技術(shù)達(dá)成的呢？

AI 繪畫的原理，簡(jiǎn)單來(lái)說(shuō)是通過(guò)神經(jīng)網(wǎng)絡(luò)模型將圖像與文本連接，基于大規(guī)模的圖文訓(xùn)練集對(duì)比學(xué)習(xí)訓(xùn)練，提取文本與圖像特征互相匹配，最終生成關(guān)聯(lián)程度較高的圖像。

與 AI 作畫相比，AI 生成視頻需要多個(gè) AI 模型的配合來(lái)完成視頻的制作。作畫與做視頻的第一步都需要預(yù)訓(xùn)練文本 - 圖像模型，先由文本生成大量的圖像。而后續(xù)的步驟就出現(xiàn)較大的差別。AI 生成視頻，在完成基本的圖像生成之后，還需要將這些圖片連起來(lái)，變成動(dòng)態(tài)清晰有邏輯的視頻。這就需要額外增加插值模型來(lái)處理圖片變成一幀幀流暢的視頻動(dòng)作，用超分辨率模型來(lái)提升圖像的像素。通過(guò)這些模型的處理，讓前后幀之間的過(guò)渡動(dòng)作更加平滑，畫質(zhì)的像素質(zhì)量更高，最終生成高分辨率和幀率的視頻。

相較于 AI 作畫，從技術(shù)上來(lái)看，視頻可以認(rèn)為是多張 " 圖片 " 有邏輯、連貫的組成。視頻幀是一張張圖像，各幀之間有畫面、邏輯等層面的關(guān)聯(lián)。因此，由文生圖與由文生視頻完全是兩種難度級(jí)別。AI 生成視頻，是 AI 生成圖像的深度延伸。

AI 生成視頻相對(duì)更難實(shí)現(xiàn)。為什么 AI 研究人員會(huì)向視頻領(lǐng)域的創(chuàng)作進(jìn)發(fā)？AI 做視頻到底有什么應(yīng)用價(jià)值呢？

AI 做視頻價(jià)值幾何？

移動(dòng)互聯(lián)網(wǎng)的繁榮，催生出了各類社交和流媒體平臺(tái)。這些平臺(tái)中豐富的圖文、視頻內(nèi)容，成為當(dāng)代人碎片時(shí)間的精神食糧。伴隨短視頻平臺(tái)和直播行業(yè)的興起，人們對(duì)內(nèi)容的需求越來(lái)越旺盛。這也筑造了規(guī)模龐大的泛內(nèi)容產(chǎn)業(yè)。

對(duì)于內(nèi)容的創(chuàng)作，核心的是創(chuàng)意與效率。但以人為核心模式的創(chuàng)作模式在高速迭代的內(nèi)容產(chǎn)業(yè)中似乎越來(lái)越趕不上趟。應(yīng)用 AI 技術(shù)來(lái)輔助內(nèi)容創(chuàng)作的 AIGC 模式，開(kāi)始滲入到泛內(nèi)容領(lǐng)域中。

從視頻的創(chuàng)作角度來(lái)說(shuō)，在腳本外，尋找匹配適合的視頻素材是創(chuàng)作的核心。雖然行業(yè)內(nèi)有大量的素材庫(kù)，但尋覓素材的過(guò)程耗費(fèi)時(shí)間，并且也不一定能找到符合腳本內(nèi)容的視頻素材。

面對(duì)提升效率與貼合腳本內(nèi)容的需求，AI 生成視頻工具可以很好地解決這類問(wèn)題。谷歌和 Meta 的 AI 視頻工具都可以基于文本描述生成視頻。

Make-A-Video 目前可以實(shí)現(xiàn)文字轉(zhuǎn)視頻、圖片轉(zhuǎn)視頻、視頻生成視頻三種功能場(chǎng)景。谷歌 Imagen Video 不僅能生成高清視頻，而且能理解并生成不同藝術(shù)風(fēng)格的作品。而谷歌 Phenaki 目前可以做到文字轉(zhuǎn)視頻，并且根據(jù)文字描述可以生成較長(zhǎng)、情節(jié)連貫的作品。Phenaki 瞄準(zhǔn)的是長(zhǎng)視頻的制作。

無(wú)論是短視頻領(lǐng)域，還是長(zhǎng)視頻領(lǐng)域，面向這些行業(yè)，AI 生成視頻都會(huì)為視頻內(nèi)容行業(yè)的發(fā)展賦予價(jià)值。

1. 提升視頻制作效率的同時(shí)降低制作成本。傳統(tǒng)的視頻制作需要腳本、收集素材、剪輯等流程，每一項(xiàng)工作都需要耗費(fèi)大量的時(shí)間與成本。AI 生成視頻可以通過(guò)文本生成視頻，或者由圖片、視頻等素材生成視頻，可以降低拍攝或搜集視頻素材的成本。AI 可以對(duì)應(yīng)著腳本文本的描述，就能生成視頻，大幅提高視頻制作的效率。

2. 增加豐富的創(chuàng)意。AI 大模型可以遍歷學(xué)習(xí)所有的創(chuàng)意與風(fēng)格。從內(nèi)容的豐富度來(lái)說(shuō)，人類無(wú)法企及。通過(guò)不同風(fēng)格、創(chuàng)意素材的喂養(yǎng)，AI 視頻生成可以創(chuàng)作出多種風(fēng)格融合的作品，補(bǔ)充人類制作視頻的創(chuàng)意。

3. 增加內(nèi)容產(chǎn)業(yè)價(jià)值。AI 視頻生成對(duì)視頻內(nèi)容領(lǐng)域的革新，為行業(yè)帶來(lái)新的應(yīng)用場(chǎng)景與新工種。AI 作畫已經(jīng)誕生出了新的職業(yè) AI 畫師。類似 AI 作圖，AI 做視頻也會(huì)誕生出新的職業(yè)，AI 剪輯師，應(yīng)用 AI 工具創(chuàng)作視頻。未來(lái) AI 生成視頻將會(huì)與游戲、影視、媒體等多行業(yè)結(jié)合，與元宇宙、AR、VR 等場(chǎng)景碰撞，創(chuàng)造出更多的場(chǎng)景與產(chǎn)業(yè)價(jià)值。

不過(guò)現(xiàn)下 AI 生成視頻的發(fā)展處于非常初級(jí)的階段，并不能完全生成出較完善的視頻。我們?cè)诠雀韬?Meta 中看到的視頻，仍然存在許多問(wèn)題。比如視頻動(dòng)作過(guò)渡不自然、理解角度詭異、視頻分辨率不高等。這些情況的出現(xiàn)原因在于 AI 工具模型的能力不高，對(duì)模型投喂的素材數(shù)據(jù)質(zhì)量有一定的要求。如果這些問(wèn)題得不到較好的解決，也會(huì)限制未來(lái)一些場(chǎng)景的應(yīng)用可能，如對(duì)于像素和邏輯要求較高的商業(yè)影視劇。而短平快的小視頻根據(jù)分發(fā)渠道的不同，質(zhì)量的參差帶來(lái)的影響不同。但歸根結(jié)底，高質(zhì)量的視頻內(nèi)容商業(yè)化的可能性會(huì)更大。

未來(lái)的商業(yè)模式

AI 生成視頻，未來(lái)的商業(yè)模式取決于不同的應(yīng)用場(chǎng)景。面對(duì)一些制作短視頻為主的小 B 端企業(yè)，如媒體、廣告、電商等行業(yè)。谷歌、Meta 等 AI 企業(yè)會(huì)為這些小 B 端企業(yè)提供 AI 視頻制作應(yīng)用服務(wù)。類似 AI 作畫的商業(yè)邏輯，可能提供按次收費(fèi)、按時(shí)長(zhǎng)付費(fèi)或者是按照不同功能與需求的制作收費(fèi)，助力這些行業(yè)提升內(nèi)容創(chuàng)造的效率，增加在線視頻領(lǐng)域的流量。不過(guò)這種商業(yè)模式的發(fā)展必須以規(guī)模化支撐，這樣才能有可持續(xù)發(fā)展的可能，畢竟 AI 廠商的視頻工具開(kāi)發(fā)與運(yùn)維成本較高。

對(duì)于以流媒體平臺(tái)分發(fā)為主，制作中長(zhǎng)視頻的影視行業(yè)來(lái)說(shuō)，需求的頻次與質(zhì)量要求較高，因此 AI 廠商需要提供的是解決方案為主的服務(wù)，甚至是定制化的服務(wù)，提供專屬的創(chuàng)作模塊，比如特效、運(yùn)鏡、轉(zhuǎn)場(chǎng)等模塊化工具。這種商業(yè)模式的價(jià)值高，但對(duì)于整個(gè)影視行業(yè)以及上下游產(chǎn)業(yè)鏈來(lái)說(shuō)，是巨大的變革。產(chǎn)業(yè)需要花費(fèi)較長(zhǎng)時(shí)間地過(guò)渡與適應(yīng)。

除了影視企業(yè)以外，游戲行業(yè)與 AI 視頻制作也會(huì)有可能碰撞出火花。游戲行業(yè)的視頻內(nèi)容開(kāi)發(fā)可以借助 AI 生成視頻來(lái)提高創(chuàng)意與效率，降低開(kāi)發(fā)的成本。對(duì)于游戲行業(yè)的商業(yè)模式也會(huì)類似影視行業(yè)提供專門的行業(yè)解決方案。

當(dāng)然，整個(gè)產(chǎn)業(yè)領(lǐng)域中，也有一些企業(yè)對(duì)視頻生成的需求并不高，但也不是完全沒(méi)有需求。比如大多數(shù)小企業(yè)都需要簡(jiǎn)單的企業(yè)宣傳視頻，或是年度的幾場(chǎng)活動(dòng)需要視頻內(nèi)容宣傳支持。一年可能就兩三次的需求，頻次較低。這些企業(yè)并沒(méi)有專業(yè)的視頻制作人員，可能會(huì)選擇應(yīng)用 AI 生成視頻工具。

如果觀察的視角從企業(yè)轉(zhuǎn)向個(gè)體的話，大部分個(gè)人消費(fèi)者也可以應(yīng)用 AI 生成視頻來(lái)娛樂(lè)。就像 AI 作圖一般，AI 生成的視頻也會(huì)成為新的社交媒體話題。網(wǎng)友可以通過(guò)輸入文本指令生成各種各樣的視頻，交流創(chuàng)意。我們或許會(huì)從被投喂的角色，轉(zhuǎn)化為創(chuàng)作者互相分享，交流創(chuàng)意與思想。

這些商業(yè)模式的可能性建立在視頻內(nèi)容優(yōu)良與成本合理的前提下。未來(lái) AI 視頻商業(yè)化的過(guò)程中，可能依然會(huì)面臨版權(quán)和倫理的問(wèn)題。無(wú)論是素材庫(kù)還是 AI 生成視頻的風(fēng)格養(yǎng)成，都離不開(kāi)人類創(chuàng)作的圖像、視頻等內(nèi)容。AI 工具需要這些人類創(chuàng)作的圖像數(shù)據(jù)訓(xùn)練迭代。這也意味著在版權(quán)方面依然存在歸屬爭(zhēng)議的灰色地帶。倫理方面，當(dāng)輸入暴力、血腥、黃色等敏感信息，生成的內(nèi)容可能會(huì)陷入倫理道德的困境。這些問(wèn)題會(huì)伴隨著視頻生成長(zhǎng)期存在，需要設(shè)置更好的機(jī)制與模式去減少這類事情的發(fā)生。

與 AI 做視頻不同，AI 作圖最終內(nèi)容可以抽象。這種圖像內(nèi)容可能藝術(shù)價(jià)值更高。但對(duì)于視頻來(lái)說(shuō)，內(nèi)容必須連貫、有邏輯。這也對(duì) AI 生成視頻的能力提出了要求。AI 生成長(zhǎng)視頻是否有邏輯，可以根據(jù)文本表達(dá)出故事性，仍然是個(gè)未知數(shù)。尤其是一些深度的內(nèi)容制作，AI 是否能夠創(chuàng)作出這類內(nèi)容需要打個(gè)問(wèn)號(hào)。而這些 AI 到達(dá)不了的領(lǐng)域，就是人類創(chuàng)作的價(jià)值地所在。

內(nèi)容的創(chuàng)作，藝術(shù)的創(chuàng)作最終導(dǎo)向的是連接，或者是連接智慧，或者是連接靈魂。人們借由藝術(shù)表達(dá)共鳴，而這些都是 AI 去不了的場(chǎng)域。未來(lái)，或許在 AI 的內(nèi)卷下，是人類高質(zhì)量?jī)?nèi)容創(chuàng)作的高峰。

原文地址：http://www.myzaker.com/article/634f60238e9f092c4d3d7e2c

ai 分辨率短視頻藝術(shù)谷歌

版權(quán)聲明：虛像發(fā)表于 2022年10月19日 am11:33。
轉(zhuǎn)載請(qǐng)注明：從AI作畫到AI做視頻，這一跳改變了什么？ | 快導(dǎo)航網(wǎng)

欧美成人黄色小视频,国产人妖乱国产精品人妖,国产性天天综合网,台湾佬中文娱乐久久久

從AI作畫到AI做視頻，這一跳改變了什么？

背刺小米12S系列用戶？小米13系列全面升級(jí)，這下不得不買了

奈飛Q3扭轉(zhuǎn)用戶流失局面新增240多萬(wàn)付費(fèi)用戶股價(jià)盤后大漲逾14%

相關(guān)文章

熱門文章

最新資訊

熱門網(wǎng)址

熱門標(biāo)簽

欧美成人黄色小视频,国产人妖乱国产精品人妖,国产性天天综合网,台湾佬中文娱乐久久久

從AI作畫到AI做視頻，這一跳改變了什么？

背刺小米12S系列用戶？小米13系列全面升級(jí)，這下不得不買了

奈飛Q3扭轉(zhuǎn)用戶流失局面 新增240多萬(wàn)付費(fèi)用戶 股價(jià)盤后大漲逾14%

相關(guān)文章

熱門文章

最新資訊

熱門網(wǎng)址

熱門標(biāo)簽

運(yùn)營(yíng)相關(guān)

軟件下載

跨境電商

購(gòu)物網(wǎng)站

設(shè)計(jì)相關(guān)

行業(yè)企業(yè)

自媒體相關(guān)

網(wǎng)絡(luò)科技

編程幫手

綜合其他

站長(zhǎng)助手

知識(shí)充能

電商運(yùn)營(yíng)

生活服務(wù)

榜單排名

服務(wù)生活

日常生活

新聞媒體

教育文化

政府組織

探索發(fā)現(xiàn)

影視工具

影視基地

工具大全

學(xué)術(shù)資源

學(xué)習(xí)教育

娛樂(lè)生活

發(fā)現(xiàn)資源

醫(yī)療健康

興趣愛(ài)好

元宇宙

體育健身

休閑娛樂(lè)

交通旅游

NFT概念

ACG

奈飛Q3扭轉(zhuǎn)用戶流失局面新增240多萬(wàn)付費(fèi)用戶股價(jià)盤后大漲逾14%