OpenAI发布GPT-4o原生绘图功能

功能发布

周二，OpenAI在GPT-4o中推出原生图像生成功能。该功能使GPT-4o能够直接生成信息图表、漫画条、标识牌、图形、菜单、表情包、路标等多样化图像。用户可以通过后续提示对生成的图像进行改进和编辑。

OpenAI已向Plus、Pro、Team和免费计划用户开放此功能，Enterprise和Edu计划用户将很快获得访问权限。API访问计划将在未来几周内逐步推出。值得注意的是，这项原生图像生成功能意味着GPT-4o可以使用其固有知识生成图像，无需依赖包括DALL-E在内的任何外部扩散模型。

用户体验反馈

电商平台Shopify首席执行官托拜厄斯·卢特克（Tobias Lutke）在社交平台X上展示了模型识别和描述其儿子T恤上未知动物解剖结构的能力，并感叹道："这怎么可能是真的？"

Row Zero创始工程师格兰特·斯拉顿（Grant Slatton）展示了如何使用GPT-4o将普通照片转换为吉卜力工作室（Studio Ghibli）风格的动画图像，引发众多用户分享各自的AI创作。

该模型还展现了强大的界面设计能力，能够仅根据文字描述生成完整的用户界面。在广告创作方面，用户报告GPT-4o能够在几分钟内几乎完美地复制并定制现有广告图像，包括更新应用程序截图等细节修改。

行业竞争态势

OpenAI此次发布紧随谷歌在Gemini 2.0 Flash AI模型中引入原生图像生成功能之后。谷歌的这项功能最初于12月向受信任的测试者推出，现已在谷歌AI Studio支持的所有地区开放使用。开发者可以通过谷歌AI Studio中的Gemini 2.0 Flash实验版本（gemini-2.0-flash-exp）和Gemini API测试这一新功能。