
一、全文速览图

谷歌正式发布了全新的 AI 生图模型 —— Nano Banana 2,技术代号 Gemini 3.1 Flash Image。

在正式介绍之前,先帮大家捋一下"命名混乱"的问题:Nano Banana(官方名称为 Gemini 2.5 Flash Image)和 Nano Banana Pro(官方名称为 Gemini 3 Pro Image)是此前已有的两代生图模型。
之前很多人习惯把 Nano Banana Pro 叫做"Banana2",但谷歌现在推出了真正的"Nano Banana 2"——所以,之前的 Pro 其实相当于"1+",今天这位才是官方认证的正统二代。好了,命名的事不重要,重要的是它到底强在哪。
一句话总结 Nano Banana 2:它是一个将 Nano Banana Pro 的高级功能与 Gemini Flash 的速度完美结合的全新图像模型。简单说就是——在 Pro 级画质的基础上,更快、更便宜了。
经过实际测试,我发现 Nano Banana 2 主要在以下几个方面带来了显著提升。
二、先进的世界知识(Advanced World Knowledge)
这是 Nano Banana 2 最让人眼前一亮的能力之一。
该模型能够调用 Gemini 的真实世界知识库,并且由来自网络搜索的实时信息和图像驱动,从而更准确地呈现特定主题。这种深度理解还能帮助你创建信息图表、将笔记转化为图表以及生成数据可视化。
这意味着什么? 举个例子,你可以让它实时搜索信息并直接生成图片。比如生成一张天气预报海报,不仅能加上地点和时间,甚至能联网查到当天的真实天气数据!
我们来看一个实际测试。提示词如下:
生成一张中国背景 2026.2.27 天气的海报,生图比例 9:16,风格:清新治愈系。画面主体:北京的城市天际线,著名地标。文字排版:主标题用圆润艺术字体写 "今日天气:天气情况,温度",搭配英文点缀;副标题 "穿衣建议";底部小字 "早安,北京";文字颜色为白色与浅绿,线条流畅,层次清晰。氛围:传递舒适、充满希望的晨间感受,适合作为城市天气海报,适配社交媒体分享。

谷歌官方为展示这一视觉落地能力,还专门构建了一个名为"Window Seat"的示例应用,利用 Nano Banana 2 的知识库和网络图片搜索,根据世界各地地点和实时天气数据来生成逼真的窗外风景。这不再是凭空想象,而是有知识、有数据支撑的"智能生图"。
三、精准文本渲染与翻译(Precision Text Rendering & Translation)
AI 生图领域一直有个老大难问题——文字渲染。之前大部分模型生成的文字不是拼写错误就是模糊不清。虽然banana pro已经能够解决这个问题,但在某些小字上还是会糊,官方说Banana 2 在这方面有了明显进步。
当然,实事求是地说,在文字渲染方面,小字(尤其是 1K 分辨率中)往往仍然会模糊,长段落和整页文字同样存在挑战。但在 2K 和 4K 分辨率下,文字表现会好很多。
看看实际测试效果,提示词:
生成一个英语学习 APP 的打卡页面,要有蜜雪冰城的雪王 IP 形象,设计风格以 iPhone iOS 26.3 的设计风格,生图比例 9:16。

它还有一个超方便的功能——直接翻译图片中的文字,这对需要做全球化内容的创作者来说很友好。
谷歌官方还为此构建了一个名为"Global Ad Localizer"的演示应用,可以将广告翻译为不同语言以适配国际市场。
四、主体一致性(Subject Consistency)
Banana Pro 的一致性保持其实已经很不错了,不论是人物角色还是物品材质,都可以很好的保留。
Nano Banana 2 在数量上做了提升:
在单个对话中,可以保持最多 5 个角色的外貌相似度,以及最多 14 个物体的视觉保真度。
用图中 5 个角色生成一则探险漫画,保持角色一致性,生图比例 16:9


这使得故事板绘制和多场景叙事在实际操作中变得更加实用。
这意味着你可以让同一组角色在不同场景、不同构图下反复出现,同时确保它们始终"长一个样"——对漫画创作、品牌素材制作、产品展示等场景来说,这是一个巨大的利好。
根据图中的角色生成盲盒放置在摆架上,生图比例 16:9


五、生产级输出规格(Production-Grade Output)
Nano Banana 2 不只是"好看",还在输出规格上全面对标专业生产需求:除了原生支持所有现有宽高比,现在还新增了 4:1、1:4、8:1 和 1:8。
可以制作超宽横屏以及超长竖屏,如果搭配 4k 分辨率,商业应用的范围就更广了

这是 8:1 的超宽横图,目前分辨率是 2k,放大还是会有些糊,因为高度 1k 都不到,
提示词直出中国风的图还是有些色调老旧,找一个国潮插画让它参考,参考出来的画风会好一点点

超长竖屏除了可以生成详情页,还可以生成漫画分镜,可玩性很多

以及还可以生成详情页,详情页最大的问题就是文字,1:8 超长竖屏,在又长文字又多的情况下,小字模糊,因为图片的分辨率为 352px*2928px;用 4k 应该会好一些


六、更多值得关注的提升
除了上面四大核心亮点,Nano Banana 2 还有一些值得一提的改进:
- 更严格的指令遵循:模型现在会更加严格地遵循复杂的、多层次的开发者提示,确保应用请求的图像正是所生成的图像。
- 更便宜的价格和更快的速度,Banana 2 的 1k 分辨率下生成图像的速度大概在 30 秒内,API 的价格,NanoBanana 2 价格约为 0.067 美元(约合人民币 0.46 元),NanoBananaPro价格约为 0.134 美元(约合人民币 0.99 元)。
总结
最后总结 Nano Banana 2 的几个核心亮点:
- 先进的世界知识 —— 接入 Gemini 知识库 + 实时联网搜索,生成的内容有据可依
- 精准文字渲染与翻译 —— 文字清晰可读,还能直接翻译图片内容
- 主体一致性 —— 最多保持 5 个角色 + 14 个物体的视觉一致性,故事板创作利器
- 生产级输出规格 —— 512px 到 4K,新增1:8 和 8:1等超宽超长比例
- 更快、更便宜 —— Flash 级速度和高性价比,面向所有用户开放
其实整体测试下来,Nano Banana 2 的亮点有,但是相比 Banana pro 的惊艳感没有了,而且感觉这次发布也很匆忙,可能和各大厂商模型互卷有关。
最后,再来总结一下 Banana 和 Banana Pro 以及 Banana 2 的区别


这代Banana 2文字渲染真能打?我上次用Pro生成小字还是糊成一团😭