- 博客
- GPT Image 2:更好的 AI 圖像工作流實用指南

GPT Image 2:更好的 AI 圖像工作流實用指南
基於 OpenAI 官方文件,了解 GPT Image 2 如何用於文字生成圖片、圖片編輯、參考圖迭代與實際製作用圖。
GPT Image 2 最有價值的地方,不是把它當成一次性的提示詞輸入框,而是把它放進可重複的圖像製作工作流。OpenAI 將 gpt-image-2 列為圖像生成與編輯模型,並標示它支援文字輸入、圖像輸入與圖像輸出。這代表一個實用流程可以從文字簡報、既有圖片,或上一輪保存下來的結果開始。
這篇文章關注實際製作:如何寫提示詞、什麼時候使用參考圖、如何檢查輸出,以及如何把接近可用的初稿推進成更完整的視覺資產。
GPT Image 2 適合放在哪些任務裡
OpenAI 的模型頁將 gpt-image-2 放在 Image models 之下,並連到圖像生成與圖像編輯端點。對日常工作來說,這主要對應兩類任務:
- 根據文字提示生成新圖片。
- 根據既有圖片和新的指令做編輯或延展。
關鍵變化在於,圖像輸入和圖像輸出可以在同一個流程裡銜接。你可以先生成方向,保存最好的版本,再把它作為下一輪的參考,而不是每次重新寫同一段提示詞。
從製作簡報開始,而不是從模糊提示開始
弱提示通常只描述風格。製作用提示詞要描述圖片需要完成的任務。
可以用這個結構:
- 主體:產品、人物、場景、物件或畫面核心。
- 構圖:視角、裁切、前景、背景和版面。
- 用途:海報、產品圖、縮圖、落地頁視覺、人像、廣告素材或概念圖。
- 視覺語言:光線、色彩、材質、情緒、寫實程度和文字排版需求。
- 限制:哪些內容不能出現,哪些細節必須清楚,哪些元素不能改變。
範例:
A premium skincare bottle on a clean stone surface, front-facing product photography, soft studio light, shallow shadow, minimal warm background, enough empty space on the right for a headline, label text crisp and readable, no extra bottles, no hands.
這種提示詞給了模型目標、版面和判斷標準,比「做一張好看的保養品廣告」更容易審核。
已經有方向時,用編輯而不是重來
OpenAI 的圖像文件區分了生成和編輯:生成從文字建立圖片,編輯則用新的提示詞修改既有圖片。當你已經有產品照、人像、插畫或值得保留的生成圖時,應該優先使用編輯。
好的編輯提示詞會同時說明「要保留什麼」和「要改什麼」:
Keep the bottle shape, label placement, and camera angle. Replace the background with a soft blue bathroom shelf scene, add natural morning light, remove glare from the cap, and keep the label readable.
這可以減少常見問題:你只是想修改背景或光線,結果整張圖都偏離原本資產。
像審核創意系統一樣審核圖片
第一張輸出只是草稿。檢查每張圖時,回到它要完成的工作:
- 圖片是否符合目標資產類型?
- 主體是否一眼清楚?
- 是否有足夠空白放標題、文案或介面?
- 重要細節在最終尺寸下是否清楚?
- 模型是否加入了不該有的物件、文字、標誌或細節?
- 這張圖是否值得作為下一輪參考?
如果某張圖已經接近可用,不要從零開始。保存它,用它作為參考,再用更窄的指令推進下一輪。
FreeGPT2 裡的一個簡單 GPT Image 2 流程
想得到可靠的圖片資產,可以用這個順序:
- 用一段話寫清楚創意簡報。
- 用同一個簡報生成幾個初始方向。
- 根據構圖和主體清晰度挑出最強版本。
- 用更窄的指令編輯或重新生成。
- 保存最終圖片和產生它的提示詞。
- 需要同系列素材時,重用保存的圖片作為參考。
這就是提示詞測試和視覺製作流程的差別。每張強結果都會變成可重用的上下文。
提示詞檢查清單
生成前,確認提示詞是否回答了這些問題:
- 這張圖要用在哪裡?
- 精確主體是什麼?
- 觀眾第一眼應該看到什麼?
- 下一個版本裡哪些部分要保持一致?
- 模型應該避免什麼?
- 圖片裁切成最終格式後是否仍然有效?
如果答案不清楚,模型就只能猜。清楚的限制通常會帶來更容易審核的輸出。
