- Hungry Strategist
- Posts
- 🦁 野性大發! 大科技公司 AI 策略的動物形象是什麼呢?
🦁 野性大發! 大科技公司 AI 策略的動物形象是什麼呢?
TLDR
文本轉圖像生成是生成式 AI 中最令人興奮的應用之一。其視覺特性創造出超越文本的動態吸引力,並且目前提供的應用範圍比視頻更廣泛。對於創作者來說,它正好落在成熟案例與尖端技術相遇的完美重合處,這也激發了本期的主題。今天,我們將通過創新的構想 “大科技公司 AI 策略的動物形象是什麼呢?” 來探索 AI 目前發展的邊界。
預估閱讀時間:5分鐘
The Unfold
生成階段規則
雖然不是要進行全面的研究,但在這裡定義一些方法論和基本規則仍然是重要的!
公司 AI 策略的推斷 → 動物描繪,通過將 prompt 輸入 ChatGPT 來完成,格式如下:
Imagine [company] AI strategy as an animal. What animal would it be?生成的動物描繪將作為種子,餵入選定的圖像生成程序,應用程序如下表:
Create an image of [company] AI strategy as an [animal], incorporating the [company] logo in a subtle and clean way.大科技公司包括亞馬遜、蘋果、Meta、微軟、Google、輝達和特斯拉
我們採用 “一發對決“規則,選出由 prompt 生成的第一幅圖像進行比較
Player / Model | UI / Access | Plan | Owner | Link |
---|---|---|---|---|
DALL-E 3 | ChatGPT | ChatGPT Plus | OpenAI | |
Imagen 3 | Gemini | Gemini Advanced | ||
Ideogram 2 | Ideogram | Free | Ideogram | |
Flux.1 | Flux | Free | Black Forest Labs |
👏 結果來嘍 …
亞馬遜
ChatGPT: 亞馬遜的 AI 策略是蜜蜂,因為它的效率、可擴展性和集體智慧。.
Hungry Strategist: DALL-E 的成效超出了預期,能夠將公司的標誌無縫地融入充滿科技感的設計中。雖然 Ideogram 和 Flux 與我期望不太一致,但它們也帶來了我意想不到的創意。Imagen 意外沒有 get 到品牌的概念。
蘋果
ChatGPT: 蘋果的 AI 策略是一隻貓頭鷹,因為它的智慧、精確和靜默的效率。
Hungry Strategist: 這讓人十分驚訝,蘋果品牌/標誌在所有模型都顯著呈現(雖然 Flux 有點在搞鬼)。我猜蘋果品牌形象龐大有著龐大的積累,與接下來的 Meta 案例形成鮮明對比。
Meta
ChatGPT: Meta 的 AI 策略是一隻變色龍,因為它具有適應性、社交智能和融入多種環境的能力。
Hungry Strategist: Meta 的標誌/品牌在各模型中不易被識別。可假設 Meta 才在2021年從 Facebook 改名,至今經歷未久。這大大減少了其在網絡上的品牌積累。但也許我們可以更改 prompt,改用「Facebook」,或強調 Meta 事實上是一家公司。
藍色的 Gmail 標誌並稱之為 Meta,看來有很多人要睡不著覺了。
微軟
ChatGPT: 微軟的 AI 策略是一隻鷹,因為它具有深遠的視野、精確度和力量。
Hungry Strategist: 雖然我們才過了清單一半,但有趣的是已可觀察到一個模式:DALL-E 在這個池中對「AI 策略」這個概念的理解最佳,展現出未來主義風格的渲染來迎合主題。 Ideogram 給人的印象與微軟在2000年代初的品牌形象相似。Flux 似乎對該強調什麼有些困惑。Imagen 讓我懷疑它是不是一直在 Google Search。
ChatGPT: Google 的 AI 策略是一隻章魚,因為它具有智慧、適應性和跨越多個領域的覆蓋能力。
Hungry Strategist: DALL-E 和 Ideogram 在這題上無疑最高分。Google 在各行業的產品的全面佈局,是我默默希望 AI 能捕捉到,並為每一個觸手標記上不同的 Google 產品。雖然這有點為難可憐的 AI,尤其在沒有更具體 prompt 的情況下,但這兩個模型確實超出了我原本的期望。至於 Imagen,章魚觸手的 Google logo 顏色是正確的。Flux 則採取了躺平的戰術對付我。
Nvidia
ChatGPT: 輝達的 AI 策略是一隻獵豹,因為它具有無與倫比的速度、力量和精確度。
Hungry Strategist: 雖然每個版本都凸顯了獵豹的速度、力量和流線型結構,但 logo 普遍以突兀的方式嵌入,讓人不禁思考與輝達相關的所有訓練數據(網路素材)是不是都長這樣。
特斯拉
ChatGPT: 特斯拉的 AI 策略是一隻黑豹,因為它具有敏捷、隱秘和不斷追求尖端技術的特性。
Hungry Strategist: Ideogram 和 Flux 在這一輪中占了高地,巧妙地結合了條紋貓額頭的斑紋,與特斯拉的“T”形標誌相結合。黑白對比也增強了優雅和簡約的氛圍。
It’s a Wrap!
一些心得感想:
ImageGen 的理解能力正在加深,未來將能以更少的時間精力達到更理想的結果 —— 雖然很多業界焦點都放在輸出的真實性和視覺吸引力上,但我發現輸入的部分更加引人入勝——特別是AI對我的理解、需求和抽象概念的掌握程度。例如,我不僅要求模型做出每個公司的動物概念圖像;我還要求它們的標誌以不違和且好看的方式整合進去。在這方面,DALL-E 3 確實脫穎而出,理解了我的訴求,通過了我的 ‘圖靈測試’ —— 讓我感覺自己像是跟一位專業插畫家合作。
這依舊是潛力巨大,人人有機會的領域 —— 全球 AI 圖像生成市場在2023年的估值為3.496億美元,預計在2024年至2030年間將以17.7%的年均增長率增長。雖然市場已經競爭激烈,但這次的研究顯示,應用的成功往往取決於模型的訓練數據與用戶期望圖像之間的對齊程度。一些模型在現實主義場景中表現優秀,而另一些則專注於平面設計。這反映了我們在所有生成式 AI 應用(文本、視頻、音頻等)中觀察到的趨勢,應用層的戰鬥才剛剛開始。
即使在現有選項中,仍有很多可探索的空間 —— 本次主題還有很多未嘗試的應用,或不適合的工具,在此也一一列出供參考:
Midjourney - 單純沒錢訂閱 (有人願意贊助嗎 😂)
Stable Diffusion - 測試過,但在品牌認識上表現差強人意(僅有特斯拉及蘋果的品牌有被認出)
Microsoft Copilot Image Generator - 測試過,模型用的也是 DALL-E 3,視覺上感覺更貼合平面設計
Adobe Generative Fill - Photoshop 裡面可調用,跟 Stable Diffusion 一樣,對品牌不太友善
Food of Thought
Why so serious?
Unbelievable photographs coming out of N. Korea today
— Philbert Leonard Downs (@PhilbertLDowns)
8:52 PM • Aug 14, 2024