Featured image of post AI 產圖自動化流程

AI 產圖自動化流程

透過 Gemini generate api,搭配腳本自動化產出標準化圖片

去年的 C2C 徽章行銷活動

C2C 是我近幾年的搖擺活動,我們每年都會在第一波售票時,執行一些特別的行銷 campaign 來宣傳活動。

去年我們意外地執行了一個口碑非常好的 徽章 企劃,這個企劃是對每一個購買盲鳥票的人,我們都額外送一個獨一無二的徽章,在寄送票券的時候跟著 email 發出。

我的徽章圖

去年我們的做法是先用一組固定的 prompt 以及 reference,在 Google AI Studio 的 web 工具上先產出多個pixel 角色圖片,篩選出適合的內容後先在後製把圖片去背以及補充細節,接著再與徽章底圖進行合成。

整個流程拆解步驟的話大概是:

Google AI Studio 產圖 -> 儲存圖片 -> 去背&補充細節 -> 後製完成徽章

去年這個徽章大概做了 196 張,而由於每一張圖片真的需要消耗不少時間去產出,而且由於沒有正式的製圖工具,我全程都是透過 Powerpoint 製作,前前後後花了大概一個月才把這些徽章產出。

NFT 概念執行,延續行銷活動

在構想今年的宣傳活動時,我們想要延續徽章這個主題,卻又不想要只是重複進行一樣的流程,而由於去年的這場行銷活動過於成功,當時的 IG 上超級多朋友將收到的這個徽章 Po 出來,因此又不想浪費去年的這個強力大眾記憶。

最後在靈光一閃之下,我們結合了 NFT 時代的應用場景,決定了我們今年的行銷企劃

限量票券:C2C 好友限量票
購買資格:去年有購買盲鳥票的人
方案說明:購買者需上傳去年購票的徽章圖片,而最後我們會將這個徽章內的角色改為雙人跳舞

測試過程

這裡先來看看最終成果,以及與去年的計畫做比較

2026 vs 2027

我特別喜歡這種透過一個符號,將記憶進行延續,來創造情感累積,如同在倚天屠龍記裡面出現的黃衫女子,以及鹿鼎記中何惕守出現並說出袁承志的段落。這種方式讓徽章不僅是一個行銷活動,而是能真正的貫徹一個品牌專屬的概念與文化。

全程自動化 - 透過 Gemini api 與 python 達成自動化

鑑於去年是在 工作很閒 的狀況下很有餘韻的產出圖片,今年換了工作實在沒辦法在上班時間偷偷一張一張圖製作,因此決定今年要透過更簡便的方式來產出這些圖片,整體原則上把任何所有重複的行為都自動化。

最終呢,我是寫了兩個 Python 腳本完成我的自動化:

  1. 透過 API 打 Google API 產出圖片
  2. 指令去背 & 組成完整徽章

我的專案結構

透過 API 打 Google API 產出圖片

我選用的是 Google Nano 的 Solution,最主要是我對於 Gemini API 比較熟悉,且大廠的 api support 比較完整,使用的 model 是 gemini-3-pro-image ,基本上就是目前釋出最好的模型,而 python 腳本則是直接餵給 AI 官方的 api 文件就生出來了。

前期測試 prompt 產出的恐怖圖

這個腳本會把我指定的圖片與 Prompt,打 nano api 產出圖片,並儲存到指定的資料夾中。在 AI 時代真正困難的是去控制產出的圖片品質,我的需求包含以下:

  1. 每次產出的圖片大小要相同,固定 600*550 px。
  2. 產出的兩個人物要固定在畫面正中央,且大小也要維持一定比例。
  3. 產出的背景顏色(除了人物以外的區域)要產出我指定的精準顏色,以便我後續透過腳本去背可以順利進行。

最早我原本是想要找類似 SDD 或其他類型的 picture skills,但花了一段時間都找不到適合的框架,因此最後還是只能依靠一個嚴謹的 Prompt 來限縮產出規範。

我最後的 Prompt 就不分享給大家了,最後靠著 Claude 來回討論寫了一個 300 多行的圖片 Prompt,除了剷除標準化的要求之外,也規範了產出的舞蹈風格、角色框架的細節要求、使用色調的規範等,最後總算可以成功率 95% 達到我要的效果,成功的 用單一腳本,量產標準化圖片,而每一張圖片從送出 API 倒回傳圖片,大約會需要 25 秒左右完成,想比去年我還要在 Web UI 上 Paste prompt 上傳圖片,最後再手動把圖片下載到 local,省下非常多步驟以及時間。

產出成果

指令去背 & 組成完整徽章

當我們能夠完美的控制 AI 產出內容後,要整合進自動化就容易多了,接下來的這個腳本要做的事情就是:

  1. 把 AI 產出的圖片去背
  2. 將 AI 去背圖、背景徽章圖、文字編號進行組合後存擋

成功產出成果

一樣就不分享 python 了,由於這一段只是傳統的指令圖片處理,在沒有 AI 介入下大概 2 秒鐘就執行完畢,而我通常也是在這時候才會去 Review 產出的內容,如果出現例如人物大小不正確、背景沒有處理好~~,或者圖片太醜或太恐怖谷~~,我會從第一步 Generate AI 圖片開始重新產出,因為去調整 python 的參數太麻煩,也不想要改完後再改回來,因此不如整個流程從頭跑過一遍。

失敗圖,原因應該是 AI 產出時沒有標準化

一個晚上完工

這次活動我們的票用限量票券,釋出 60 張照片,而這 60 張在新的工作流程下,大約 2 個小時就完成所有圖片以及處理好寄信的問題老實說大多時間是花在整理報名者資料以及圖片,實際製作新圖的時間可能只有 30-40 分鐘。

總之很喜歡自己這次的成果,透過 AI 以及自動化將過去大量繁瑣的手工流程簡化,來大幅增加工作效率,這種成就感真的是每次都不會膩。

comments powered by Disqus