GPT Image 1は、OpenAI初のネイティブマルチモーダル画像モデルで、2025年3月にGPT-4oの一部として初めて公開されました。拡散ベースで画像を生成していたDALL-Eシリーズとは異なり、自己回帰アーキテクチャを採用し、単一モデル内でテキストからの画像生成と画像変換の両方を実行します。テキストレンダリングの精度、フォトリアリズム、文脈に基づくプロンプト理解で大きな飛躍を遂げ、公開直後にはジブリ風画像の生成で大きな話題を呼びました。
GPT Image 1は、OpenAI初のネイティブマルチモーダル画像モデルで、2025年3月にGPT-4oの一部として初めて公開されました。拡散ベースで画像を生成していたDALL-Eシリーズとは異なり、自己回帰アーキテクチャを採用し、単一モデル内でテキストからの画像生成と画像変換の両方を実行します。テキストレンダリングの精度、フォトリアリズム、文脈に基づくプロンプト理解で大きな飛躍を遂げ、公開直後にはジブリ風画像の生成で大きな話題を呼びました。