资讯频道首页 | 社会看点 | 花边杂烩 | 今日阳谷 | 民俗名胜 | 生活服务 | 招商加盟 | 公告公示 | 房产家居 | 娱乐频道 | 阳谷论坛
您所在的位置:阳谷信息港 > 资讯频道 > 社会看点

太魔幻了!刚刚OpenAI发布GPT Image 1.5:Nano Banana Pro 王座不保

发布:2025/12/30 8:57:16  来源:网络  浏览次  编辑:佚名  分享/转发»


Sam Altman 反击谷歌,OpenAI新旗舰图像模型来了

就在刚刚,OpenAI正式发布了新版ChatGPT Images,由全新的旗舰图像生成模型GPT Image 1.5驱动

这一次,无论是从零开始生成图像,还是编辑现有照片,新模型都能实现“所想即所得”


核心升级主要体现在三个方面:精准修图且保留细节指令遵循能力更强,以及生成速度提升了4倍

我立马就测试了两个手头的case:ChatGPT Images vs Nano Banana Pro

                                                                    提示词

这是一张室内人像写真风格的照片,整体偏向干净、柔和、略带时尚感与亲密氛围,下面我从构图、人物、服装、姿态、光线与整体气质几个层面来忠实、细致地描述:

?

一、整体构图与环境

?竖幅构图,人物几乎占据画面主体,视觉重心集中在人物的上半身与面部。

?场景是一个简约现代的室内空间,背景为大面积纯白色墙面,干净、无杂物,刻意弱化环境存在感。

?人物坐在一张黑色皮质沙发上,沙发表面线条硬朗,与人物柔和的肤色形成对比。

?沙发上铺着一块黑白相间的长毛绒毯,毛感明显,增加了画面的层次与触感?

二、人物外貌与面部特征

?人物为一位年轻女性,整体气质偏清秀、柔和。

?肤色白皙均匀,质感细腻,几乎看不到明显瑕疵。

?脸型偏鹅蛋脸,下颌线柔和,没有明显棱角。

?五官比例协调:

?眼睛偏大,双眼皮清晰,眼神平静、直视镜头,带有一点若有若无的疏离感。

?鼻梁挺直但不夸张。

?嘴唇偏小,唇色自然,表情克制,没有明显微笑。

?整体妆容为清淡自然妆:

?底妆轻薄

?眼妆干净,没有明显烟熏或夸张色彩

?唇妆偏裸色或淡粉色

?

三、发型与发质

?长直发,发色为偏暖的深棕色。

?中分发型,分缝笔直,左右对称。

?头发顺直、贴合,发尾自然垂落至腰部附近,整体显得柔顺、有光泽。

?发量看起来较多,线条干净,没有明显卷度。

?

四、服装细节

?穿着一件白色蕾丝连衣裙:

?无袖设计,露出肩部与手臂

?V 领或浅领口,领口处有精细的蕾丝花纹

?裙身贴合身体曲线,但并不夸张

?裙摆长度偏短,停留在大腿中上部

?面料为蕾丝+内衬结构,蕾丝纹理清晰,风格偏女性化、柔美。

?

五、姿态与肢体语言

?人物以侧坐姿坐在沙发上:

?上半身微微前倾

?一只手自然搭在沙发或毛毯上

?另一只手轻放在腿部

?双腿弯曲收拢,姿态显得放松而内敛。

?整体肢体语言偏安静、克制、略带亲密但不过分张扬。

?

六、光线与摄影风格

?使用的是柔和的棚拍或自然补光:

?光线均匀,没有强烈阴影

?面部和身体轮廓被柔化

?色温偏中性或微暖,突出肤色的细腻感。

?背景虚化不明显,但因背景简洁,人物自然突出。

?整体风格接近商业人像 / 时尚写真 / AI 或高精修风格。

?

七、整体气质总结

这张照片给人的感觉是:
?干净
?精致
?柔和
?带一点冷静与疏离
?偏“被观看”的人像美学,而非抓拍或纪实
2k分辨率

这是生成的效果:


第二个case:

                                                                    提示词:
{

描述:一幅超逼真的3D 等距视角杰作,描绘了一幅展开在光滑深色木桌上的魔法地图。地图绘制在一张古老而饱经风霜的羊皮纸卷轴上,但画面中的景色以立体模型的形式跃然纸上。巍峨的岩石山脉,白雪皑皑的山峰,穿透缕缕白云;一条蜿蜒的碧绿河流从中心流过;山麓覆盖着茂密葱郁的松林。羊皮纸边缘呈锯齿状,左侧饰有精美的复古书法,角落则绘有罗盘玫瑰图案。画面采用温暖的电影级光照,焦点清晰,纹理细节丰富,2K 分辨率,以奇幻冒险为主题。

"negative_prompt": "扁平的,2D 的,简单的图画,模糊的,低质量的,扭曲的,有水印的,糟糕的人体结构,文字叠加,颗粒感强的",

“参数”: {

"aspect_ratio": "2:3",

"风格": "电影级3D 渲染",

"视图": "等距"

}

}

生成的效果:


看起来ChatGPT Images指令遵循的要比NBR要强(人像),审美能力还不好说

目前ChatGPT Images 在 大模型竞技场图像排名第一


接下来几天我会大量测试,看看实际表现

与此同时,GPT Image 1.5 API也已同步上线,价格相比上一代直降20%

下面我们一起来看ChatGPT Images具体细节

精准修图:指哪打哪,细节不丢

新版模型最大的亮点在于对用户意图的精准还原

当用户要求对上传的图片进行编辑时,模型能够更可靠地遵循指令,仅改变用户要求的部分。

而在这一过程中,原图中光线、构图以及人物外观等关键要素,都能在输入、输出及后续的连续编辑中保持一致

这就意味着,ChatGPT现在不仅能完成更实用的照片修饰,还能实现更逼真的服装和发型试穿。同时,它支持在保留原图精髓的基础上,进行风格化滤镜和概念转换

具体到编辑操作上,模型擅长多种类型,包括:

  • ? 添加(Adding)

  • ? 删减(Subtracting)

  • ? 组合(Combining)

  • ? 混合(Blending)

  • ? 移位(Transposing)








简而言之,用户可以在得到想要的改变的同时,不丢失让图片显得特别的那些原始细节。OpenAI称其为“口袋里的创意工作室”

创意与能力的全面进化

除了修图,GPT Image 1.5在创意生成和基础能力上也有显著提升:

创意变换:模型可以通过改变和添加元素(如文本和布局)来实现创意转化,同时保留重要细节,这个和Nano Banana Pro表现感觉差不多








更强的指令遵循:相比初代版本,新模型能更可靠地执行指令。这不仅利于精准修图,也能在生成复杂的原创构图时,按预期保留元素间的关系


文本渲染能力强悍升级:在处理更密集、更小的文本时,模型表现强悍




画质提升:在渲染许多小人脸以及整体输出的自然度等方面,质量均有改进


全新交互:无需提示词也能玩

为了让图像探索更快捷,OpenAI在ChatGPT中推出了专门的Images主页

用户可以通过移动应用的侧边栏或chatgpt.com访问该页面。这里不再强制要求用户编写提示词,而是内置了数十种预设的滤镜和提示,帮助用户快速启动灵感

这些预设内容会定期更新,以反映当下的流行趋势

API上线:更便宜,更适合企业

对于开发者和企业用户,GPT Image 1.5 API也已同步开放。

相比GPT Image 1,新版API在图像输入和输出的价格上便宜了20%,这意味着在相同预算下可以进行更多的生成和迭代。

在能力上,API版本继承了ChatGPT Images的所有改进,特别是在图像一致性方面表现更强:

能够跨编辑保持品牌Logo和关键视觉元素的一致性

非常适合营销材料制作(如图形和Logo创作)

适用于电商团队,可基于单一源图像生成完整的产品目录(包括不同变体、场景和角度)

目前,已有创意工具、电商、营销软件等领域的企业开始使用GPT Image 1.5。

最后

ChatGPT Images的新版本即日起向全球所有ChatGPT用户和API用户推送。

该功能跨模型工作,用户在使用时无需进行额外选择

至于今年早些时候推出的旧版ChatGPT Images,将作为一个自定义GPT(Custom GPT)保留,供有需要的用户继续使用

--end--

相关文章

网友评论

评论加载中...
推广链接

网站首页 | 分类信息 | 企业商圈 | 网上商城 | 你问我答 | Blog | 阳谷论坛

免责声明: 本站所有新闻文章来源于网络,仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,对新闻文章以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容!

(特别声明:视频、图文版权属于原作者,如构成侵权,请及时联系我们,会在第一时间删除!删稿请发至邮箱:4143080@qq.com)

Copyright © 2003-2009 www.yanggu.tv All rights reserved.