OpenAI 4o:圖像生成新突破,真實度爆燈!

我們要深入探討 OpenAI 最新推出的圖像生成技術——4o。這項技術不僅將 AI 生成圖像的真實度提升到新高度,更能保持角色的一致性,為創作者帶來前所未有的可能性。
什麼是 OpenAI 4o?
OpenAI 4o 並非全新的產品,而是在現有文字生成、Base 模型基礎上,提供了一種嶄新的圖像生成方法。4o 的最大特點是:
- 生成圖像的真實度大幅提高
- 能夠保持角色的一致性(consistency)
- 支援連續性創作,如同講述一個完整故事
這種能夠維持角色一致性的特性,讓使用者可以創建連貫的視覺敘事,就像在講述一個完整的故事一樣,這正是 4o 技術最令人印象深刻的地方。
OpenAI 官方展示
在 4o 發布後的幾小時內,OpenAI 進行了一場直播介紹這項新技術。直播中,OpenAI 的研究科學家展示了 4o 的多項突破性能力:
- 完整且準確地在圖像中呈現文字(這在 AI 生成領域一直是個難題)
- 多模態(Multi-modal)功能展示,包括圖像和聲音的輸入輸出
- 風格轉換能力,如將普通照片轉為動漫風格
- 支援對話式修改,使用者可直接通過對話調整生成結果
4o 的實用功能
圖像上傳與參考
4o 允許使用者上傳圖像作為參考,這包括:
- 角色參考(Character Reference):讓 AI 參考特定角色的外觀
- 風格參考(Style Reference):讓 AI 模仿特定的視覺風格
例如,在展示中,有人上傳了自己寵物狗的照片,然後要求 4o 創建一張類似交易卡(Trading Card)的圖像,結果非常成功。

角色一致性展示
OpenAI 在其網站上展示了 4o 如何保持角色一致性的例子:
- 一個場景中,AI 生成了一位在白板前的人物,背景是金門大橋
- 當要求繼續生成這個人物與他人擊掌(High-five)的場景時,AI 能夠保持人物的外觀特徵,如髮型和臉部輪廓

實際測試結果
作者進行了幾項實驗來測試 4o 的能力:
與 GPT-4.5 的比較
- 使用相同的提示詞,GPT-4.5 生成的圖像較為插畫風格,看起來不太真實
- 而 4o 生成的圖像真實度明顯提高,細節更為豐富

上傳個人照片測試
作者上傳了自己的照片,並要求 4o 進行修改:
- 將原本的女性角色改為男性
- 結果顯示 4o 能夠保持場景的一致性,同時實現性別轉換

「加頭髮」測試
這是一項常見的 AI 圖像編輯測試:
- 作者上傳自己的照片(光頭),要求 AI 為其添加頭髮
- 結果顯示 4o 在添加頭髮的同時,稍微改變了作者的面部特徵
- 衣服、背景等元素保持高度真實,但人物面部有所變化
- 膚色變深,整體面部特徵與原照片有所差異

與其他工具的比較
作者還比較了不同平台的「加頭髮」效果:
- Grok 3:修改後人物變成了另一個人

- Google AI Studio:保持了原有面部特徵,但頭髮添加效果不自然,像戴了假髮

- OpenAI 4o:雖然面部特徵有些變化,但整體效果更為自然
AI 圖像生成的未來趨勢
隨著 OpenAI、Google 和其他科技巨頭在同一個月內相繼推出各自的 AI 圖像生成工具,我們可以看到:
- AI 生成圖像的真實度正迅速提高
- 「深偽」(Deepfake)情況可能會變得更加普遍
- 圖像編輯和生成技術正變得越來越強大且易於使用
總結
OpenAI 4o 代表了 AI 圖像生成技術的重大突破,其高真實度和角色一致性功能為創作者提供了強大的新工具。雖然在某些方面(如面部特徵修改)仍有改進空間,但 4o 無疑將 AI 圖像生成推向了新的高度。
隨著這些技術的不斷發展,我們可以期待在不久的將來看到更多令人驚嘆的 AI 生成內容,同時也需要關注這些技術可能帶來的倫理和社會影響。