欧美成人黄色小视频,国产人妖乱国产精品人妖,国产性天天综合网,台湾佬中文娱乐久久久

「羊駝打籃球」怎么畫?有人花了13美元逼DALL·E 2亮出真本事

前沿科技 3年前 (2022) 虛像
3 0 0

選自 Medium

作者:Joy Zhang

機器之心編譯

充值之前,建議你先學會「調教」 DALL · E 2。

2022 年,DALL · E 算是火出圈了。

4 月初,OpenAI 的開創性模型 DALL · E 2 登場,為圖像生成和處理領域樹立了新的標桿。只需輸入簡短的文字 prompt,DALL · E 2 就可以生成全新的圖像,這些圖像以語義上十分合理的方式將不同且不相關的對象組合起來。

很多人都迫不及待地上手試試——博主 Joy Zhang 在 5 月初注冊了候補名單,并在 7 月底獲得了訪問權限。在測試期間,用戶會收到積分(第一個月免費 50 個積分,之后每月 15 個積分),每次使用需要 1 個積分,每次使用會產生 3-4 張圖像。如果不夠用,還可以花 15 美元購買 115 個積分。

「羊駝打籃球」怎么畫?有人花了13美元逼DALL·E 2亮出真本事

你可能已經在網上看到過各種精心挑選的圖片,展示了 DALL · E 2 的能力(提供了正確的創意 prompt)。

在一篇博客中,她分享了一些演示,以說明如何從頭開始為主題創建一個可用的圖像:「一只大羊駝打籃球」。

起點

給 DALL · E 2 喂 prompt 是一門學問。首先,下圖是「大羊駝打籃球」的生成結果:

「羊駝打籃球」怎么畫?有人花了13美元逼DALL·E 2亮出真本事

為什么 DALL · E 2 傾向于為這個 prompt 生成卡通圖像?她認為這與訓練期間模型沒怎么見過大羊駝打籃球真實圖像有關。

她試圖通過添加關鍵詞「真實照片」更進一步:

「羊駝打籃球」怎么畫?有人花了13美元逼DALL·E 2亮出真本事

這只大羊駝看起來更逼真,但整個圖像開始看起來像是一個拙劣的 Photoshop 作品。在這種情況下,DALL · E 2 顯然需要一些手工技巧來創造一個更逼真的場景。

Prompt 工程

在 DALL · E 的上下文中,prompt 工程是指設計 prompt 以提供你想要的結果的過程。

DALL · E 2 Prompt Book 是一個很好的資源,包含使用攝影和藝術關鍵詞的 prompt 靈感的詳細列表。

地址:https://dallery.gallery/the-dalle-2-prompt-book/

為什么這樣的事情是有必要的?因為從 DALL · E 2 獲得可用的輸出是不確定性的(尤其是當你不確定 DALL · E 2 的能力時)。以至于一家新的初創公司正在創建一個收費 1.99 美元的相關業務,以節省人們自己提出 prompt 的時間和金錢。

她個人最喜歡的發現是「戲劇背光」,下圖的 prompt 是:

「Film still of a llama dunking a basketball, low angle, extreme long shot, indoors, dramatic backlighting.」

「羊駝打籃球」怎么畫?有人花了13美元逼DALL·E 2亮出真本事

告訴 DALL · E 2 你想要什么很重要。顯然,從上下文來看,這只大羊駝的著裝并不適合這種場合。然而,當指定「穿著運動衫的大羊駝」時,DALL · E 2 很好地實現了這個場景:

「羊駝打籃球」怎么畫?有人花了13美元逼DALL·E 2亮出真本事

不止于此,為了給圖像添加一些戲劇性并真正讓這只大羊駝飛起來,她需要指定諸如「扣籃」、「動作鏡頭 」之類的短語,或者她個人最喜歡的「穿著球衣的大羊駝像邁克爾喬丹一樣扣籃」:

「羊駝打籃球」怎么畫?有人花了13美元逼DALL·E 2亮出真本事

你可能已經注意到:DALL · E 2 的構圖并不出色。

你會認為,從「扣籃」的上下文來看,大羊駝、球和籃筐的相對位置應該是顯而易見的。通常情況下,大羊駝的扣籃方式是錯誤,或者球的位置使大羊駝沒有按照真正想要的方式投籃。盡管 prompt 的所有元素都在那里,但 DALL · E 2 并沒有真正理解它們之間的關系。

「羊駝打籃球」怎么畫?有人花了13美元逼DALL·E 2亮出真本事

DALL · E 2 沒有真正「理解」場景的另一個特征是偶爾出現的紋理混淆。在下圖中,籃網是由毛皮制成的(想想就覺得很詭異):

「羊駝打籃球」怎么畫?有人花了13美元逼DALL·E 2亮出真本事

DALL · E 2 生成的面孔不夠逼真

DALL · E 2 生成的面孔似乎沒有那么逼真,有人認為,這是模型為了避免重現在訓練中看到的面孔而故意為之,不然就可能遭遇之前 deepfake 遇到的問題。作者原本以為這僅適用于人類受試者,但顯然,它也適用于大羊駝。

有些結果簡直令人毛骨悚然:

「羊駝打籃球」怎么畫?有人花了13美元逼DALL·E 2亮出真本事

DALL · E 2 的其他一些限制

以下是她遇到的其他一些問題:

角度和鏡頭總是被忽略

無論她使用了多少「遠景」或「超遠景」的說法,都很難找到整只大羊駝都能進入畫面的圖像。

在某些情況下,框架問題被完全忽略:

「羊駝打籃球」怎么畫?有人花了13美元逼DALL·E 2亮出真本事

DALL · E 2 不會拼寫

鑒于 DALL · E 2 很難理解各個成分之間的關系,不會拼寫倒也不足為奇。然而,它還是能夠在正確的上下文中嘗試一些成形的字母:

「羊駝打籃球」怎么畫?有人花了13美元逼DALL·E 2亮出真本事

DALL · E 2 可能會因復雜或措辭不當的 prompt 而喜怒無常

有時,以某些方式添加關鍵詞會導致與預期完全不同的結果。

在這種情況下,prompt 的真正主題(穿著運動衫的大羊駝)被完全忽略了:

「羊駝打籃球」怎么畫?有人花了13美元逼DALL·E 2亮出真本事

即使添加「蓬松」一詞也會導致性能顯著下降,并且在多個情況下看起來 DALL · E 2 只是 …… 壞了:

「羊駝打籃球」怎么畫?有人花了13美元逼DALL·E 2亮出真本事

在使用 DALL · E 2 時,重要的是要具體說明你想要什么,而不要過度填充或添加多余的詞匯。

DALL · E 2 的風格轉換能力令人印象深刻

你需要試試這個!

一旦有了關鍵詞主題,你就能以令人印象深刻的其他藝術風格生成圖像。比如「…… 的抽象畫」:

「羊駝打籃球」怎么畫?有人花了13美元逼DALL·E 2亮出真本事

蒸汽波:

「羊駝打籃球」怎么畫?有人花了13美元逼DALL·E 2亮出真本事

數字藝術:

「羊駝打籃球」怎么畫?有人花了13美元逼DALL·E 2亮出真本事

宮崎駿動畫電影截圖:

「羊駝打籃球」怎么畫?有人花了13美元逼DALL·E 2亮出真本事

經過 100 多個積分的嘗試(大概 13 美元)和反復試驗,她的最終圖像如下:

「羊駝打籃球」怎么畫?有人花了13美元逼DALL·E 2亮出真本事

最終版的 prompt 是:「Film still of a llama in a jersey dunking a basketball like Michael Jordan, low angle, show from below, tilted frame, 35°, Dutch angle, extreme long shot, high detail, indoors, dramatic backlighting.」

圖像并不完美,但 DALL · E 2 設法完成了大約 80% 的要求。

嗯 …… 怎么不算成功呢?

原文地址:http://www.myzaker.com/article/63411106b15ec03b68063d67

版權聲明:虛像 發表于 2022年10月8日 pm2:42。
轉載請注明:「羊駝打籃球」怎么畫?有人花了13美元逼DALL·E 2亮出真本事 | 快導航網

相關文章

主站蜘蛛池模板: 阳谷县| 双鸭山市| 阿图什市| 宁安市| 施甸县| 合川市| 安庆市| 吉木萨尔县| 开阳县| 扎兰屯市| 天津市| 石嘴山市| 兴国县| 象州县| 舒城县| 泾川县| 濮阳县| 会宁县| 海盐县| 汤原县| 鲁山县| 芒康县| 南岸区| 自贡市| 西充县| 台东县| 寿阳县| 酉阳| 河北省| 迁西县| 灯塔市| 翁源县| 安宁市| 陇南市| 乌苏市| 清涧县| 郓城县| 姜堰市| 漾濞| 石城县| 独山县|