画像: OpenAI
今週初め、OpenAIは「これまでで最も高度な画像生成器」をリリースし、GPT-4oモデルを用いたChatGPTを通じて利用できるようにしました。ChatGPTはこれまで、画像生成にDall-Eを使用していました。
OpenAIによると、改良された4oモデルは、正確で精密、そしてフォトリアリスティックな結果を生成できるとのことです。また、テキストのレンダリング、指示の正確な実行、さらにはチャットの文脈の理解にも特に優れているとされています。これには、アップロードされた画像の変換や、アップロードされた画像を視覚的なインスピレーションとして利用することも含まれます。

ジョエル・リー / ファウンドリー
GPT-4oは既存の画像を基に継続的に構築することで、画像間で被写体の一貫性を保つことができます。さらに、GPT-4oは現在、画像内の10~20個の異なるオブジェクトを処理できるようになりました(他の多くのAI画像生成ツールでは、5~8個の異なるオブジェクトを含めるのに苦労しています)。
同時に、OpenAIは、GPT-4oには、切り取り、幻覚、要素が多すぎる、正確なグラフ、非ラテンアルファベットでのテキストのレンダリング、正確な編集、小さな表面への高密度のテキストの大量表示などの問題がある可能性があると警告している。
新しく改良された4o画像ジェネレーターは、ChatGPT Free、Plus、Pro、Teamユーザー向けに現在公開中です。(EnterpriseおよびEduユーザーは後日アクセス可能になります。)Dall-Eの方がより良い画像を作成していると思われる場合は、Dall-Eに切り替えてそちらを使用することもできます。
さらに読む: ChatGPTにこんなことは言わないほうがいい。その理由は?
この記事はもともと当社の姉妹誌 PC för Alla に掲載され、スウェーデン語から翻訳およびローカライズされました。