我承认 Anthropic 和 Google 都很强,但是今天,OpenAI 要更胜一筹。
一夜之间,AI 做图以假乱真的能力,可能要提高 1000 倍了。
让乔布斯代言小米SU7,海报它能直接安排上。

让奥特曼直播卖课,截图也直接以假乱真。

让它生成非主流的QQ空间截图,它连 BGM 和歌手都一一对应准确。

甚至还能直接做出库克官宣卸任苹果CEO,宣布由老罗来接任的微博截图。
底下还自动拉来了王自如的评论。

这就是 OpenAI 刚发布的新图像模型 GPT-image-2。

上面看到地那些离谱图片,都是用它来直接搓出来的。
毫不夸张地说,AI 做图的能力,从来没有如此强过。
在大模型竞技场里,当大家的平均分都在1200分左右厮杀的时候。
GPT-image-2 直接给干到了 1500 分,遥遥领先其他模型。

而且这玩意还不是个期货。
可能是 Sora 被关闭了之后,OpenAI 的算力变的更多了。
所以山姆奥特曼也是大放善心,现在不管你是免费用户还是付费用户,都可以在 ChatGPT 的官网里直接用上。
就连 API 也是直接开放,不但量大管饱,而且价格还只要 Nano Banana Pro 的 1/4。
我们也帮大家简单的试了一下。
只要你上传一张参考图片,它就可以精准还原你的形象。
有了它,你可以随意穿越到任何游戏里。

或者是和任何角色合影。
生成这个角色和原神里的旅行者(女)绝区零里的铃,崩坏星穹铁道里的星 这三个角色的合影,背景是无垠的宇宙

而且你也可以用它来生成各种奇奇怪怪的图像。
比如原神和塞尔达的联名海报。

宝可梦和幻兽帕鲁的联动新闻

甚至就连火锅(眼睛健康版)在白宫散步的照片也能一键生成。

除此之外,新模型还有着非常丰富的知识储备,堪称 AI 界的懂王。
即使你问到了它不懂的东西,GPT-image-2 也会直接开始进入思考,现查现学。

比如我直接给他出了到一元二次方程的题,要求给个教材的截图。 它是真的带脑子,直接一步步推到出了答案。
经常上学的网友也可以验算看看,看看答案对不对。

与此同时,GPT-image-2 还能生成非常稳定,高质量的中文文本,在它给出的图像里,文字出现崩坏的概率小了非常多。
让它做个西湖醋鱼的制作流程也能一次完成,效果要比 Nano Banana Pro 不知道要高到哪里去了
帮我制作西湖醋鱼这道菜的详细制作流程图,真实风格,适用于小红书图文比例(右边是 Gemini 做的。

当然,差评君用下来感觉最重要的是,这次的 GPT-image-2 的模型审美非常好。
你不用费太多力气写一大堆提示词,他就能给你出一张 90 分的图片。
像是下面这种红白机的宣传海报。
生成一张苹果风格的任天堂红白机宣传海报

抖音的女主播带货截图,甚至今天你在前面看到的绝大多数案例。

都是只要用了一句话,或者几句话的描述就能做出来的。
你还能发现,在生成抖音截图里,AI 观众还会在弹幕里实时交流,给咱们开演一波小剧场。

这也是它相比过去模型所不同的地方。
过去你想让 AI 做一张抖音截图,你可能得告诉它这张图的最上面是什么,最右边得放什么,下面放什么。
整个画面必须像真实手机截图,而不是设计图。需要完整呈现短视频直播 UI 叠层:
顶部有状态栏,显示时间、电量、信号、Wi-Fi;
左上角有主播头像、用户名、直播中标识、实时在线人数;
右侧有一排直播交互按钮,比如点赞、评论、分享、礼物、关注;
底部有半透明评论区,观众弹幕不断刷过,内容是中文,口语化、简短、像真实直播弹幕;
右下角有礼物特效入口、购物袋入口或者更多功能按钮;
底部输入栏有“说点什么...”之类的互动区域;
直播界面中有平台风格的红色或高亮直播标识;
整体布局必须符合真实中国直播平台的移动端视觉习惯。
给 AI 写一大堆提示词。
但现在,只要简单说一句话,AI 就会自动搞懂你的意思。
搞不懂的地方,它还会自己去查。
和年初的 Seedance 2.0 一样,用好 AI 的门槛再一次被狠狠的打下来了。
有图有真相的时代,算是彻底的和我们切割了。
新模型做出来的很多图像,不但能够轻松骗过我们的眼睛。
就连专门的 AI 图像检测助手也是直接睁眼瞎了。


今天编辑部的小伙伴玩了一天之后,直接被这个模型以假乱真的能力给搞到破防,直接发出我们这辈完蛋了的感慨。
大家在群里看到的每一张图,都要思考这玩意是不是 AI 给做的。

不过,虽然现在的新模型能力已经很强了,但是在高强度的试用后,我们还是发现了一些缺点,哦不,美中不足的地方。
最让我绷不住的是,我们在一些图片右下角。

隐隐约约地发现了 Gemini 的水印。

不知道是不是蒸馏过nano banana的数据。或者说网上的图片数据,已经被nano banana给污染霍霍完了。
导致新模型被这些有毒数据污染了。。

同时,我们还发现这次的 GPT- image-2 虽然生成出来的汉字虽然很稳,但是同时,这些字也失去了灵魂。
如果我们直接让他来生成一幅书法真迹,你会发现它做的好像还挺有模有样的。
生成《兰亭序》真迹放在桌面上的图片

可一旦你让他把这幅书法字帖里的字给换掉,大家就会发现,它做出来的字,印刷感还是蛮重的,完全不是手写的风格。

再包括很多文字,在放大细看的情况下,还是有一丝微崩。
也期待友商或者下个版本,能彻底堵上这些Bug吧。
AI 圈真的像是有一种轮回,先是OpenAI一骑绝尘,之后谷歌逆袭,再来个Anthropic砸场。还有个随时可能掀桌的 DeepSeek。
而现在,我们的位置,又来到了这里。

另外再友情提醒一下,从 GPT-image-1 爆火、全网刷屏吉卜力头像,到 Nano Banana 魔性出圈、网络上被 AI 生成图疯狂刷屏,再到如今 Image-2 直接降维打击,前后其实才一年多。
已经不敢想,明年的这个时候,AI会进化成啥样了。
本文来源:差评
惠普(HP) 有线鼠标 商务办公家用经典左右手通用对称鼠标有线 电脑笔记本USB接口即插即用 发光轻音(黑色)
¥26.9
¥26.9
中兴(ZTE)F30 Pro 随身wifi6免插卡移动wifi无线网卡便携式热点4g路由器无限笔记本电脑通用流量2025款
¥48.9
¥48.9
嘉柏兰【国家3C认证丨20000毫安丨可上飞机】顶配版超级快充迷你大容量充电宝移动电源 20000毫安顶配版
微星品牌主机酷睿i5 12600KF/RTX4060/4060TI/5060/5060TI海景房游戏主机电脑台式机优惠补贴组装电脑 配三 13600KF+首发RTX5060
华硕游戏主机 酷睿i5 12600KF/14600KF RTX4060/4060Ti/5060/5060ti/5070游戏组装电脑DIY台式游戏整机 配三福利版 i5-13600KF+RTX5060
嘉柏兰【国家3C认证丨20000毫安】MagSafe磁吸充电宝移动电源20W超级快充超薄迷你便携无线适用苹果华为 【顶配版20000毫安】国家3C认证丨可上飞机 全系通用丨高品质电芯丨当日次日达
佰维(BIWIN)128GB TF(MicroSD)内存卡 C10 U3 V30 A1 MS100存储卡 读速100MB/s 适配行车记录仪/监控
嘉柏兰【国家3C认证丨20000毫安】充电宝适用小米120W超级快充大容量可上飞机自带线移动电源小巧便携 【尊享版2万毫安】自带双线+120W超级快充
嘉柏兰【柏林之声丨2025最新款】蓝牙耳机挂耳式无线骨传导概念耳夹运动跑步音乐降噪超长续航不伤&耳朵 【苍穹黑】久戴不痛/跑步不掉/超长续航
网友评论