隐姓埋名的小香蕉 悄悄吊着打所有生图模型!

zhiyongz 阅读:7 2025-08-29 19:30:15 评论:0
前一阵子,大模型竞技场 LMArena 里面悄咪咪地出现了一个神秘的图片模型 —— nano-banana,在一众生图模型里面乱杀。
这个小香蕉无名无姓,可一旦在 LMArena 抽到它,对手必被吊打。
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
这个神秘的模型在生图一致性上强得惊人,对提示词的理解和完成度也好得可怕。大伙儿你一票我一票,迅速把它送上了榜单第一位。
就在众人纷纷猜测新模型到底出身哪个高门大户的时候,谷歌 AI Studio 的产品 Leader 跳出来发了一个香蕉,暗戳戳地认领了 nano-banana。
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
而就在昨天,nano-banana 终于正式上线谷歌 AI Studio,直接去 Gemini 那里就能玩,不用竞技场费事抽卡了。
谷歌在官方博客里是这么秀肌肉的:开局一张脸,以后不管是啥场景,啥服装,啥表情,都能让人一眼看出来你还是你。
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
把几张照片搓在一起,生成的结果既能保证原来的形象不崩,又能保证新图片看起来不违和。
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
还能多轮对话改同一张图,每次只改一点点,其它部分就像是妈生原图一样,丝毫不变。
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
官方的案例看起来是挺吊的,还没玩上的差友也别急,咱这就带大伙儿一起体验一下。
为了感受一下其它模型和 nano-banana 的差距,我们先上 LMArena 去抽了几波卡。
结果是,一共抽了十几轮,只要谜底里有 banana,你一定会盲选 banana。。。有些对比还是非常惨烈的。
像是让人物手里加一根香蕉,右边 seededit 的手崩了,香蕉的颜色也过于鲜艳,和整体画风不搭,但左边基本挑不出啥毛病。
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
再比如让鲁迅不要抽烟改拿笔,右边这个细节变了一堆不说,笔头还冒着烟呢。
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
这么看来,nano-banana 比现在的生图模型都强是没啥疑问的。但它具体强在哪些方面呢?我们又去谷歌 Studio 有针对性地测了测。
先说结论,我们觉得 nano-banana 最强的点,是它对图片有了更深入的理解,保证了一致性。而在强一致性的基础上,修图、换风格、做 3D 手办。。。它非常全面,啥都干得挺好。
比如这种一键试穿,需要把平铺的各种服饰 P 到人的身上,而 nano-banana 对细节的把控非常到位。
鞋本来提供的是侧面图,但它画出了正面的样子。服饰上各种 logo 拼的都是对的,甚至 T 恤上原本镜像的 ‘SAINT LAURENT’,在生图的过程中也变回来了。
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
我们还试了试人脸的不同角度生成,这个效果是真的很厉害。
下面这三张图,只有第一张是真实照片,后面两张都是生成的。
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
这种面部方向的调整在老模型里是很难实现的,因为要通过一张平面图理解一张立体的脸各个角度长啥样很难,但 nano-banana 的完成度也非常高。
另外,我们还测了一些合照拉郎配。
可以看得出,在这种合照里,它做的不只是把两个人物拼在一起,而是学习到了面部特征。这样生成的新图片即使表情不太样,还是能让人一眼看出这是小马小札。
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
还有大伙儿最爱的 3D 手办系列,分分钟把 100 多斤的火锅压缩成茶杯犬,化身桌面可爱小摆件,火锅群里的同事们纷纷求出货。
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
最牛的还属这一张 —— 火锅前阵子右后腿皮肤病剃秃了一块,而生成的图片居然注意到了这一点,一致性真拉满了。
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
不过有一说一,nano-banana 的图像风格变换比较中规中矩,倒是没啥特别的。
但在这个过程中,我们发现它不光在处理图片,还在偷偷 “ 认人 ”。
像是下面这张图,在我们没有告诉谁是谁的情况下,它还是认出来左边是搞火箭的马斯克,右边是 META 的扎克伯格。
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
我们又试了几个地标开盒,看看它有没有 GPT 那样的推理能力。
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
但实际上它只在地标建筑物上比较好使,更像是图像识别 + 记忆检索,只能说有一点推理能力,但不多。
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
左 nano-banana 答错,右 GPT 5 Thinking 答对
除了上述的优点,它的缺点其实也不少。。。最大的问题就是,谷歌好像给它做了不少安全性调教,经常这也不行,那也不行,有时候真摸不清哪个关键词又触犯天条了。
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
其次是对提示词要求比较高,往好了说,是 nano-banana 对提示词的遵循能力强,但实际上对用户来讲,得多花不少时间打磨提示词,有点折磨。
谷歌自己也表示,别让 Gemini 猜你的心思,有啥想要的尽管说出来。
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
所以要是出来的效果不好,写提示词的时候就得尽量详细一些,什么要动,什么不要动通通列明白,才能保证强一致性。
最后,比起咱心目中的 P 图白月光 FLUX,它在局部小范围修图上效果还是差了一点,所以还是建议大伙儿精修找 FLUX,上面各种整大活儿再用 nano-banana。
左原图,中 nano-banana,右 FLUX
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
总的来说,nano-banana 强就强在它对图片的理解能力是目前最好的,而且各种任务上的一致性都不错,没有大短板。
更大的好消息是,小香蕉已经被整合进了 2.5 Flash 版本,即使没有 pro 会员,免费的账户也可以使用。
只要左上角选择 2.5 Flash,对话框 tools 选择 Image 即可。
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
LMAreana 上也依然可用,只要 prompt 开头输入 “ 使用 nano-banana 模型生成 ” ,有极高概率可以抽到。
或者有些整合网站像是 LibLib,Fal-ai 等等也有第三方提供的 nano-banana。
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
隐姓埋名的小香蕉 悄悄吊着打所有生图模型!
感兴趣的差友赶紧去试试吧,欢迎回来评论区返图哦。



本文 三波网 原创,转载保留链接!网址:https://www.bbbr.net/articles/63312.html

标签:生图模型
可以去百度分享获取分享代码输入这里。
声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

发表评论
搜索
排行榜