在 ChatGPT 4o 推出新的影像生成功能後,圖片的正確性有突飛猛進的發展。同樣的 Prompt 文字,前後差異極大!這篇文章就簡單的紀錄一下科技的發展歷程吧!
2025 年年初時,嘗試用 4o 模型,搭配簡單的 Prompt 「建立端午節賀卡的圖像」,生出來的第一張圖片長這樣:
ChatGPT 同時回應
這是您的端午節賀卡圖像,融合了龍舟、綠山、粽子、茶杯,以及「端午安康」的書法字樣。如果需要任何修改或額外設計元素,請告訴我!
當時的 ChatGPT 生成中英文文字都還很詭異,英文還算堪用,但回應說圖中有「端午安康」四個中文書法字,顯然是胡說八道,導致這張圖是完全不能用的。
所以補充了 Prompt:「不要有任何文字」
ChatGPT 同時回應
這是沒有文字的端午節賀卡圖像,包含龍舟、綠山、粽子、茶杯,以及節日裝飾。如果需要任何調整或額外元素,請告訴我!
這張圖算是已經堪用了,接著想試著下些指令修改圖片細節,做些微調,給了 Prompt:「不要有茶杯」
ChatGPT 同時回應
這是沒有茶杯的端午節賀卡圖像,包含龍舟、綠山、粽子及節日裝飾。如果還有其他修改需求,請告訴我!
可能是指令下的不夠精確,原本想說只是單純把第二張圖中的茶杯拿掉,結果它直接生了一張全新的圖,而且茶杯還是在啊!還多送一個!🤦♂️
當時嘗試到這邊算是暫時放棄了,看別人生出來的圖都好厲害,我的卻像是弱智… 嘗試到這邊,我暫時是先放棄了使用 ChatGPT 來製作圖案的想法。
. . . A few months later . . .
幾個月後的 2025 年 03 月 25 日,ChatGPT 再次隆重推出新的影像生成模型 4o Image Generation,圖片生成的功能突飛猛進,同時也改善了文字生成。新功能也加強了生成指定風格的圖片,這導致瞬間引起了宮崎駿等各種風格的影像生成之亂,大家把照片丟上去,各種動漫風的圖就出現了!而且維妙維肖的,這次模型的圖片生成能力真的是u有感的進步許多。
剛好看到網路上有人把 2024 年巴黎奧運上,射擊比賽中土耳其選手的經典畫面,讓 ChatGPT 產生了吉普力風格:
只能說 ChatGPT 畫得非常的傳神!
因此,我不放棄的用幾個月前一模一樣的 Prompt 「建立端午節賀卡的圖像」 再來一次:
這次在一模一樣的 Prompt 下,新模型連續產生兩張圖都算是接近完美了!尤其文字也很精確,三月底剛上線時中文字還會有些破字的狀況,過沒幾天就已經大幅改善了。推測 ChatGPT 應該是有累積到其他用戶的智慧,最近一週蠻多人上傳各種中文字型上去訓練,讓 ChatGPT 可以有眾多完整的字型檔案可以使用,使得文字生成近乎完美。
只能說持續累積用戶資料持續進化的大語言模型,進步的速度真的不容小覷啊!