新闻动态
你的位置:age官网入口下载苹果 > 新闻动态 > 我有身体了!深度评测豆包 Seedream 4.0 图像模型 比Banana更香、更适合中国宝宝体质...
我有身体了!深度评测豆包 Seedream 4.0 图像模型 比Banana更香、更适合中国宝宝体质...
发布日期:2025-10-09 00:00    点击次数:130

今年AI 图像模型的迭代给人带来的惊喜远大于语言模型,从GPT 4o Image 的引爆全网,再到Gemini Nano Banana,从最初的“能出图”到如今的“能控图、精准改图到真的几乎可以替代绝大部分Photoshop功能,实现了言出法随的人类梦寐以求的目前”,创作体验正在发生质变。

就在Gemini Nano Banana热度还没过去,我们还在期感叹国产模型何时也能这样的时候,豆包推出了他们的权限 Seedream 4.0图像模型——一款定位为“生成与编辑一体化”的图像模型。

没错!就是和Nano Banana 同样定位的图像编辑模型。据说是和小香蕉能力不相上下...

那么这款和Gemini Nano Banana具有同样能力的,在中文支持方面更符合国人宝宝体质的图像模型究竟如何呢?

那么和以前一样,小互我继续为大家进行一个全方位的测评,给大家展示其能力水平...

直接开始...

01

基础核心能力展示

第一部分,老规矩,还是有请本人头像亲自出场...

图片

打开今日头条查看图片详情

主要测试其精准指令编辑能力和特征保持能力

精准指令编辑:用自然语言描述就能轻松完成增删、替换、局部修改等操作,省去了反复 prompt 调试的麻烦。

高度特征保持:无论是角色外形还是画面细节,都能比较稳定地延续下来,尤其在跨风格(插画→3D→摄影)场景里,角色不容易“变脸”。

下面是我的测试:

在豆包上传我的头像,要求其根据我头像生成我的身体,众所周知我一直没有身体只有头像。

图片

打开今日头条查看图片详情

看看效果...

我有身体了...

图片

打开今日头条查看图片详情

而且保留了我头像的特征和面部的表情,包括我招牌的犀利眼神和红框眼镜

图片

打开今日头条查看图片详情

下面我选取第一张图像,继续进行后续的要求

让给我一杯星巴克咖啡,然后再喝一口星咖啡,同时更换背景画面

都很好的完成了我的要求

然后我们还可以用生成的参考照片去生成其他图像

比如这样

面部形象特征都做到了很好的保持

图片

打开今日头条查看图片详情

02

推理能力

豆包 Seedream 4.0另一个明显的提升是对模糊需求的理解,也就是模型的推理能力,这个至关重要,因为只有模型推理能力上去后,它的衍生功能才能得到极大的发挥。

以前 AI 更像是“词对图”,现在更像是“语义对图”。

深度意图理解:对模糊描述的理解力增强,比如你说“未来感的书店”,模型会自动捕捉元素并合理组合,不需要逐字拆解。

语义理解更像“听人话”:对模糊的创意描述能自动补充分镜元素,和之前“词对图”的堆砌相比更有整体感。

多图输入/输出:支持把多张图放进来做合成、迁移,或者一次性生成组图,非常适合做分镜或脑暴。

图片

打开今日头条查看图片详情

测试下来发现,Seedream 4.0推理能力得到了极大的提升,相较于之前的3.0,个人感觉至少提高了好几倍。

这种理解力的增强,也意味着它的“推理预测”更强。比如把图中的毯子叠好放在沙发上。

图片

打开今日头条查看图片详情

下面我们进行具体测试

这是一个肯德基的餐品图,我们看到这有两个盒子

下面我们让豆包把这两个盒子打开看看里面有什么...

图片

打开今日头条查看图片详情

我们看到它打开了盒子,并展示了里面的失误,第一个长盒子我觉得展示的是很正确的,第二个盒子我个人认为里面应该是个汉堡

但是它给我展示的是炸鸡,不过这个可能是盒子上有英文误导了这一结果。

总体还是不错的

但是还没有完,我们将进行极限测试

我们注意到这个可乐是没有吸管的,不方便我喝,我需要个吸管

让豆包给我的可乐插个吸管

图片

打开今日头条查看图片详情

我们看到吸管很完美的插入到了可乐中...

这时候我又发现,没有番茄酱,我这个人很喜欢吃番茄酱

我必须要开个番茄酱才行

图片

打开今日头条查看图片详情

我们看到番茄酱也有了,而且放在了合适的位置上

好了现在我可以坐下来好好享受我的肯德基了

那么我发现我没有桌位,这个难不住我

图片

打开今日头条查看图片详情

我有豆包

来了...

图片

打开今日头条查看图片详情

看到没,我终于吃上了肯德基,哈哈哈...

图片

打开今日头条查看图片详情

这些都是基于模型的强大推理能力,全程我只是进行文字提示聊天,上传参考图,它自己会根据你的要求进行自动合成。

这个时候我发现,我的脸有点黑,发型也不时尚

另外我的鞋子左右也不一致

图片

打开今日头条查看图片详情

所以我继续要求豆包给我:美颜一下、换个时髦的发型,把我的鞋子换成一样的...

图片

打开今日头条查看图片详情

图片

打开今日头条查看图片详情

这就很时髦很完美了,可以看到它现在都能给人美颜了,再也不用找胡德禄弄时行的的发型了

03

和Banana的对比

下面我们来拿Gemini Nano Banana 很火的一些案例来和豆包 Seedream 4.0 进行对比,看看两者的差距和优缺点。

1.多图融合

你可以给它多张图片让它组合

比如我们上传奥特曼的照片+字节跳动的体恤+一个姿势图

图片

打开今日头条查看图片详情

让模型将这些图进行组合生成一个完整的照片

图片

打开今日头条查看图片详情

我们看到在整个推理组合的过程中,两个模型都是很不错的,姿势还原度和衣服贴合度都很完美,但是如果放大仔细看,Nano Banana在人物的面部保持方面略微的好一些,豆包的面部细节有瑕疵,同时不能和图片表现的运动羡慕应该展现的表情相吻合。

2.2D变3D

上传普通的照片生成3D手办

图片

打开今日头条查看图片详情

图片

打开今日头条查看图片详情

我们看到除了在色彩饱和度上有一些差距外,3D还原度上还是不分上下的,效果都很不错。

3.老照片上色

给老旧照片上色...

这个也是仁者见仁智者见智,Nano Banana 的色彩可能还原更符合老照片的状态,豆包的略微偏黄,但是可以通过提示继续纠正。

4.室内设计能力

将床铺放在空旷的房间里,并逐步添加一些家居

图片

打开今日头条查看图片详情

图片

打开今日头条查看图片详情

这个我觉得豆包在整个效果上更好,但是它给出了房间的另一个视角角度,没有遵循原图的视角方向,这个不好评,看你们喜欢。

04

总结一下

总体来说在图像编辑和推理方面 Seedream 4.0 和 Gemini Nano Banana 已经非常的接近,在各个方面不相上下,整体感受是推理能力 Nano Banana 还是略微强大一些,但是在图像编辑和其他控制方面已经不分伯仲。

剩下的就是每个人的个人主观感受问题。

可以说:不必在意国外的小香蕉,我们有自己的豆包 Seedream 4.0 更香更甜...

图片

打开今日头条查看图片详情

当然还有很多方面我没有能够展示出来,我只是展示了一些核心功能。

官方有个详细的功能展示和精细的提示手册:

https://bytedance.larkoffice.com/docx/XwngdqdhIowfF8xhEA4cwpS2nLb

你们可以看看

下面是一些案例展示:

1、用图2的图案替换图1的衣服花纹,图3的图案替换图1的墙面

图片

打开今日头条查看图片详情

图片

打开今日头条查看图片详情

2、将图1的主体替换为图2的主体

图片

打开今日头条查看图片详情

图片

打开今日头条查看图片详情

图片

打开今日头条查看图片详情

图片

打开今日头条查看图片详情

3、证件照生成

提示词模板:一张以图片中人物为主的证件照,展示腰部以上,照片居中、正面拍摄、【蓝色】背景。

图片

打开今日头条查看图片详情

4、更改镜头深度

图片

打开今日头条查看图片详情

将景别改成全景、远景、中景、近景...

图片

打开今日头条查看图片详情

5、变换风格和创意发散

图片

打开今日头条查看图片详情

将图片拆解成衣服、裤子、配饰、鞋子等元素,整齐的矩阵式网格将多张独立图片组合在一起,每张图片作为一个视觉元素单元,通过统一的白色背景和均等间距分隔,整体展示在一张九宫格图里。

图片

打开今日头条查看图片详情

变换各种风格

6.多参考图生成

根据上述的网格图像生成画面

更多案例请自行在豆包选择:AI生图/视频 尝试

体验入口:

(1)即梦网页端-图片生成-上传参考图-选择图片 4.0 模型-输入 提示词(操作方便,但是需要积分)

(2)豆包 App 对话框-AI 生图/生视频-上传参考图-输入 提示词或者需求即可。(完全免费)

加入XiaoHu.ai 日报社群 每天获取最新的AI信息

打开今日头条查看图片详情

____________

End.

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报。

下一篇:没有了