TikTok 亂拳打死老師傅：硅谷大廠還在發論文，它產品已經上線了

前沿科技 3年前 (2022) 虛像

突然間，AI 文字轉圖片成為了全球科技業的一大流行技術趨勢。

幾周前我們報道了" 新一代梗圖之王 " DALL · E mini，一個腦洞十分清奇的文字轉圖片 AI 小工具。當時我們也提到，包括谷歌、OpenAI 等大公司和頂級研究機構都在開發相關模型，就連時尚雜志《COSMO》都采用 AI 來設計雜志封面。

圖片來源：COSMO 雜志

然而令許多人沒想到是：

就在各家硅谷大廠斥巨資研發、砸了無數的人力、發了無數的論文，卻還在測試相關技術的時候，TikTok 居然異軍突起，首先把 AI 文字轉圖片做到了產品里，而且直接交到了全球十億用戶的手上 ……

亂拳打死老師傅，中國速度太快了

在 TikTok 的特效菜單下，最近增加了一個名叫 "AI 綠幕 " ( AI Greenscreen ) 的新選項。

點擊這個選項，然后在屏幕中間的對話框里輸入一段文字描述，只用不到 5 秒的時間，TikTok 就可以根據文字描述生成一張豎版畫作，用作短視頻的背景：

圖片來源：硅星人截圖

TikTok 用的這個文字轉圖片模型，還是非常簡單的。硅星人測試了幾個含義大相徑庭的提示，生成的圖片可以說都十分的 " 迷幻 "，沒有任何寫實色彩。

但這并不是缺點點——正相反，生成結果具有非常強的水彩 / 油畫感覺，風格遷移 ( style transfer ) 的痕跡明顯，而且用的顏色也都鮮亮明快，給人一種耳目一新的感受。

圖片來源：TechCrunch 截圖

我還想單獨說一下下面我自己生成的圖片：

下圖左邊的提示字段是知名游戲 " 最后生還者 "。生成結果的辨識度太高了，這不正是游戲主角 Ellie 被泥漿血水浸濕的頭發嗎？

右圖更有意思，提示是 " 轟炸 "：我完全沒有想到如此 " 不和諧 " 的字段，TikTok 的模型居然生成的結果卻相當的 " 自洽 "，特別是圖中的 " 轟炸機 " 反而看起來像是代表和平的 " 白鴿 " ——是否你也能讀出一點諷刺的意味？

圖片來源：硅星人截圖

當然話說回來，這些只是我自己的解讀和感受，絕不可能是模型的 " 本意 "。但是有趣的藝術作品不正應該是這樣嘛，讓人能夠發現一些巧妙的 " 彩蛋 "，甚至浮想聯翩，解讀出另外的含義。

從這一角度，我還是非常認可 TikTok 目前部署的這個模型的。

模型的質量也值得一提。The Verge、TechCrunch 等美國媒體測試了一些特殊的敏感字段，AI 綠幕生成結果更加抽象了，顯示出字節部署的模型在爭議字段上可能已經做出了提前規避。

要知道 AI 文字生成圖片本來就不是簡單技術，避免爭議 / 道德風險更是一項相當復雜的工作。

圖片來源：The Verge 截圖

正如文章前面提到，谷歌、OpenAI 等巨頭公司和知名機構開發的 AI 文字生成圖片模型，目前都處于剛剛發布或者小范圍測試，還在 " 紙上談兵 " 的階段。

這邊 TikTok 不僅很快跟進推出了同類模型，更厲害的是已經將其投放到全球十億用戶量級別的產品里了。

本來以為 AI 藝術創作的潮流還是幾個硅谷大廠在引領，沒想到字節跳動居然 " 亂拳打死老師傅 " ——必須給中國互聯網科技公司的工作速度和質量點贊了。

AI 創作成潮流，硅谷大廠擠破頭

早在 2020 年，全球知名的人工智能基礎科研機構 OpenAI 發布了一個名為 GPT-3 語言模型。當時 OpenAI 的論文題為 "Language Models are Few-Shot Learners"，直接點出了超大規模語言模型在多種非訓練人物上具備強大、快速的學習和掌握能力。

GPT-3 也完全沒令人失望，在小范圍開放測試 API 之后，外界人士用它開發出了各種各樣神奇的 demo，展示了寫段子、翻譯公式、解數學題、完成用戶界面設計、生成財務報表等能力。

"AI 文字生成圖片 " 也是這些能力的其中一項。

圖片來源：硅星人

包括 OpenAI、谷歌、Midjourney、Stability AI 等一眾大小公司，已經開發出了多個文字轉圖片生成模型，展示出神經網絡模型具備令人驚訝的藝術創作能力。

從 AI 文字轉圖片生成技術開始得到公眾關注，到今天各路大廠和小公司擠破頭也要摻和，各種不開放的、開放的、收費和免費的模型層出不窮 …… 也就過去了一年左右的時間。

在這些模型當中，OpenAI 的 DALL · E 是最著名的一款。該模型一代于 2021 年推出，今年剛剛更新到了二代。用戶只需提供自然語言描述，模型就能夠生成非常寫實 ( photorealisitic ) 的圖片。

圖片來源：OpenAI

除了從零開始生成全新照片，DALL · E 2 還有更多功能，適合現實中多種藝術工作場景。

比如它的編輯能力，可以在一張已經存在的照片中，在用戶任選的位置 " 刪除 " 或者 " 添加 " 物體，并且編輯后的效果仍然很寫實：

圖示：在照片的不同位置添加 " 火烈鳥 "。圖片來源：OpenAI

再比如 DALL · E 2 還具備 " 啟發 " 的能力，能夠根據一張已經給定的圖片，生成風格近相同的新照片：

圖片來源：OpenAI

順便一提：有個跟 OpenAI 沒關系的第三方開發者，自己仿著 DALL · E 做了一個圖片生成模型，還給免費開放了，取名為 DALL · E mini。

結果這個 " 仿制品 " 比正品還受歡迎，在社交網絡 Twitter 上專門搬運這個模型生成的奇怪圖片的賬號，粉絲量都破了百萬。甚至逼得 OpenAI 專門出來澄清跟它沒關系，要求開發者做出改變。現在這個免費小工具已經改名為 Craiyon 了。

（聽說此事之后，粉絲們還做了一張梗圖，嘲笑 OpenAI 那邊還在控制測試權限，這邊 DALL · E mini 早就給全網玩嗨了 ……）

圖片來源：FALSEKNEES

而在硅谷大廠的行列當中，現在谷歌是已知動作最快的，在 DALL · E 2 出來不久后也發布了自己的模型，名為 Imagen。

就像 DALL · E 的根源是語言超大模型 GPT-3，Imagen 的根源也是谷歌開發的泛用型超大語言模型 T5。至于 Imagen 的這個命名，其實是圖片 ( image ) + 生成 ( generate ) 的混成詞。

圖片來源：Google Research

雖然做的比 DALL · E 晚，同樣作為硅谷知名 AI 研究型公司的谷歌，還是非常不服 OpenAI 的，宣稱找人做了一堆同類模型的盲測，結果是受試者更喜歡 Imagen 生成的結果，認為其在 " 生成質量 " 和 " 文字描述還原度 " 上都更勝一籌。

——當然，究竟是 DALL · E 2 和 Imagen 誰的生成結果更好，還是一個很主觀的，見仁見智的事情。在技術實現上，這兩家其實大同小異，都是用了 Diffusion（擴散）模型生成，然后再用 Super-Resolution（超分辨率 ) 技術來讓生成結果更加清晰。

圖片來源：Google Research

還有更多規模更小的新創公司也在做 AI 圖片生成和藝術創作這件事。

其中一家比較有意思的公司就是 Midjourney，其創始人是原知名動作感應技術公司 Leap Motion 創始人 David Holz；公司的投資人和顧問團隊更是相當強大，都是蘋果、特斯拉、AMD、GitHub 等知名公司的核心人物。

Midjourney 跟 OpenAI、谷歌的寫實方向背道而馳，而是在抽象、藝術性、獨特風格之間尋求某種巧妙的結合點，這也是這家公司和其模型比較特別之處。另外 Midjourney 開放模型技術的做法也很 " 年輕化 "，不是發布 API 和文檔，而是把服務接口做到了聊天軟件 Discord 里。

圖片來源：Midjourney

說完這些比較知名的公司，再來看一家名不見經傳，但是和 TikTok 一樣出手極快的美國公司：Stability AI。

這家公司總部位于硅谷 Los Altos，在上周剛剛發布了一個可以免費使用的 AI 圖片生成產品 Stable Diffusion。

圖片來源：Stability AI

Stable Diffusion 和前面介紹的幾個寫實派模型沒有太大不同。但是和產品、公司名稱里的 " 穩定 " 正相反，這個模型在有害 / 爭議字段的處理上，可以說完全沒有任何作為。而又因為產品是完全免費提供給公眾的，已經有很多用戶用它制作 deepfake、暴力、恐怖主義、虛假新聞圖片等有害的內容了 ……

最近大半年，AI 圖片生成已經成為了一個名副其實的科技行業 " 熱詞 "，只是沒想到，Open AI 和谷歌做了這么多年，卻被 TikTok 給悄無聲息地跑贏了。接下來，應該會有更多的科技公司也參與其中，不少全民應用背后的大廠估計又要忙活著把這項技術加到產品中了。

* 注：封面圖來自于 TikTok，版權屬于原作者。如果不同意使用，請盡快聯系我們，我們會立即刪除。

原文地址：http://www.myzaker.com/article/62fafb608e9f091b4661d5e2

ai tiktok 創始人谷歌

版權聲明：虛像發表于 2022年8月16日 am11:43。
轉載請注明：TikTok 亂拳打死老師傅：硅谷大廠還在發論文，它產品已經上線了 | 快導航網

欧美成人黄色小视频,国产人妖乱国产精品人妖,国产性天天综合网,台湾佬中文娱乐久久久

TikTok 亂拳打死老師傅：硅谷大廠還在發論文，它產品已經上線了

手機“大逃殺”：組裝工人收入暴跌代工廠閑置種蘑菇

谷歌宣布 Android 13 正式開源，手機廠商已可使用

相關文章

熱門文章

最新資訊

熱門網址

熱門標簽

欧美成人黄色小视频,国产人妖乱国产精品人妖,国产性天天综合网,台湾佬中文娱乐久久久

TikTok 亂拳打死老師傅：硅谷大廠還在發論文，它產品已經上線了

手機“大逃殺”：組裝工人收入暴跌 代工廠閑置種蘑菇

谷歌宣布 Android 13 正式開源，手機廠商已可使用

相關文章

熱門文章

最新資訊

熱門網址

熱門標簽

運營相關

軟件下載

跨境電商

購物網站

設計相關

行業企業

自媒體相關

網絡科技

編程幫手

綜合其他

站長助手

知識充能

電商運營

生活服務

榜單排名

服務生活

日常生活

新聞媒體

教育文化

政府組織

探索發現

影視工具

影視基地

工具大全

學術資源

學習教育

娛樂生活

發現資源

醫療健康

興趣愛好

元宇宙

體育健身

休閑娛樂

交通旅游

NFT概念

ACG

手機“大逃殺”：組裝工人收入暴跌代工廠閑置種蘑菇