ChatGPT 4o Image Generation

在 ChatGPT 4o 推出新的影像生成功能後，圖片的正確性有突飛猛進的發展。同樣的 Prompt 文字，前後差異極大！這篇文章就簡單的紀錄一下科技的發展歷程吧！

2025 年年初時，嘗試用 4o 模型，搭配簡單的 Prompt 「建立端午節賀卡的圖像」，生出來的第一張圖片長這樣：

ChatGPT 同時回應

這是您的端午節賀卡圖像，融合了龍舟、綠山、粽子、茶杯，以及「端午安康」的書法字樣。如果需要任何修改或額外設計元素，請告訴我！

當時的 ChatGPT 生成中英文文字都還很詭異，英文還算堪用，但回應說圖中有「端午安康」四個中文書法字，顯然是胡說八道，導致這張圖是完全不能用的。

所以補充了 Prompt：「不要有任何文字」

ChatGPT 同時回應

這是沒有文字的端午節賀卡圖像，包含龍舟、綠山、粽子、茶杯，以及節日裝飾。如果需要任何調整或額外元素，請告訴我！

這張圖算是已經堪用了，接著想試著下些指令修改圖片細節，做些微調，給了 Prompt：「不要有茶杯」

ChatGPT 同時回應

這是沒有茶杯的端午節賀卡圖像，包含龍舟、綠山、粽子及節日裝飾。如果還有其他修改需求，請告訴我！

可能是指令下的不夠精確，原本想說只是單純把第二張圖中的茶杯拿掉，結果它直接生了一張全新的圖，而且茶杯還是在啊！還多送一個！🤦‍♂️

當時嘗試到這邊算是暫時放棄了，看別人生出來的圖都好厲害，我的卻像是弱智… 嘗試到這邊，我暫時是先放棄了使用 ChatGPT 來製作圖案的想法。

. . . A few months later . . .

幾個月後的 2025 年 03 月 25 日，ChatGPT 再次隆重推出新的影像生成模型 4o Image Generation，圖片生成的功能突飛猛進，同時也改善了文字生成。新功能也加強了生成指定風格的圖片，這導致瞬間引起了宮崎駿等各種風格的影像生成之亂，大家把照片丟上去，各種動漫風的圖就出現了！而且維妙維肖的，這次模型的圖片生成能力真的是u有感的進步許多。

剛好看到網路上有人把 2024 年巴黎奧運上，射擊比賽中土耳其選手的經典畫面，讓 ChatGPT 產生了吉普力風格：

只能說 ChatGPT 畫得非常的傳神！

因此，我不放棄的用幾個月前一模一樣的 Prompt 「建立端午節賀卡的圖像」再來一次：

這次在一模一樣的 Prompt 下，新模型連續產生兩張圖都算是接近完美了！尤其文字也很精確，三月底剛上線時中文字還會有些破字的狀況，過沒幾天就已經大幅改善了。推測 ChatGPT 應該是有累積到其他用戶的智慧，最近一週蠻多人上傳各種中文字型上去訓練，讓 ChatGPT 可以有眾多完整的字型檔案可以使用，使得文字生成近乎完美。

只能說持續累積用戶資料持續進化的大語言模型，進步的速度真的不容小覷啊！