![图片[1]-学术特供版Nano Banana来了!Google亲自下场,直接对齐NeurIPS审美-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251208235640308-1765209400-bd9bc6838679ed2ca2d7558267214b8d.gif)
懂代码、懂审美的 AI 绘图天团,专治科研人的画图焦虑。
赶论文时最让人头大的,不是算力,也不是数据,而是画图。
虽然 AI 早就学会了补全代码、甚至自动设计实验,但在赶 deadline 的时候,绝大多数人还得打开 draw.io 或 visio 手动对齐像素。
虽然市面上也有不少 Nano Banana Pro 辅助科研绘图的教程,但这通常需要不断微调复杂的 Prompt,靠抽卡来碰运气。
Google Cloud AI Research 联合北大团队最新发布的 PaperBanana,就是为了终结这种痛苦。
![图片[2]-学术特供版Nano Banana来了!Google亲自下场,直接对齐NeurIPS审美-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/02/20260205183401594-1770287641-73e15f324a4584007bd59b758c66ba27.png)
论文链接:
https://arxiv.org/pdf/2601.23265
项目主页:
https://dwzhu-pku.github.io/PaperBanana/
GitHub链接:
https://github.com/dwzhu-pku/PaperBanana
这是一套基于 Nano Banana Pro 构建的智能体框架。它不仅读得懂你的方法章节,更能严格遵循 NeurIPS 的审美标准,全自动生成发表级的方法架构图和统计图表。
![图片[3]-学术特供版Nano Banana来了!Google亲自下场,直接对齐NeurIPS审美-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/02/20260205183401447-1770287641-e7a431b61c4109907906f0b33d5e85a4.jpeg)
![图片[4]-学术特供版Nano Banana来了!Google亲自下场,直接对齐NeurIPS审美-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251208235641526-1765209401-fbfd139e91f52781a670bb6ed101f4c3-scaled.png)
5 个智能体是如何分工的?
为什么通用的 Nano Banana Pro 很难直接画好学术图?核心难点在于它不懂空间逻辑。
学术架构图要求模块间的数据流向绝对严谨,而生成模型天生擅长发散,经常会出现幻觉——该连的线没连,不该连的线乱连。
PaperBanana 组建了一支由 5 个智能体构成的绘图团队,模拟人类绘制学术插图的完整思维链。
![图片[14]-学术特供版Nano Banana来了!Google亲自下场,直接对齐NeurIPS审美-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/02/20260205183402719-1770287642-9fd78b6f1362d0c2e8b5f30578ace8aa.png)
来看看这个绘图天团的配置:
检索(Retriever):解决无从下笔的难题。利用 RAG 技术从图库中检索结构相似的参考图,为生成提供视觉灵感,让布局有章可循。
规划(Planner):核心大脑。它将不可控的像素生成任务,降维成可控的结构化文本描述,实现内容与样式的解耦。
审美(Stylist):注入灵魂的一步。基于内置的 NeurIPS 审美指南,强制对齐配色与排版,拒绝 AI 霓虹感。
绘图(Visualizer):采用混合渲染策略——架构图调用 Nano Banana Pro 生成,而统计图直接生成 Matplotlib 代码,确保数据绝对精准。
为什么必须写代码?看下图对比:
![图片[15]-学术特供版Nano Banana来了!Google亲自下场,直接对齐NeurIPS审美-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/02/20260205183405404-1770287645-6140247923afb82a9ffc08923f29c836.png)
左边是用 AI 直接画的,虽然好看但容易出现数值幻觉,右边是 AI 写代码画的,朴素但绝对精准。
审查(Critic):引入闭环反馈。模拟导师视角审查细节,检查漏项或错连,支持最多 3 轮自动迭代。
![图片[16]-学术特供版Nano Banana来了!Google亲自下场,直接对齐NeurIPS审美-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251215190818681-1765796898-f6159061e56206da5ddc8ed1fcbecbb1-scaled.png)
顶会级审美
很多 AI 生成的图没法直接用于投稿,主要是因为审美风格不够学术——颜色太艳、背景太黑、特效太浮夸。
研究团队从 5275 篇 NeurIPS 论文中筛选并分析了高质量样本,总结出了一套详细的审美标准(详见论文 Appendix F),并将这套标准内置在审美智能体中。
你不需要记住这些参数,Agent 会全自动替你执行。
🎨 NeurIPS 2025 Aesthetic Guidelines (Lite)
配色:严禁高饱和霓虹色,推荐科技柔和色,如淡蓝 (#E6F3FF) 搭配柔和的橙色。
背景:必须保持纯白或极淡的灰,严禁使用纯黑背景。
几何:推荐圆角矩形,直角仅限矩阵表示。
字体:区分层级——数学变量用 LaTeX 风,普通标签用 Sans-Serif。
这种审美对齐有多管用?看下图:
![图片[26]-学术特供版Nano Banana来了!Google亲自下场,直接对齐NeurIPS审美-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/02/20260205183406496-1770287646-70327a93f3a166cf530b6d1db8909bad.png)
未经审美对齐的 Nano Banana Pro 虽然生成了基本的图表结构,但在整体质感上显得较为粗糙,缺乏专业学术图表应有的规范性。
相比之下,PaperBanana 的生成结果完美拿捏了 NeurIPS 顶会的视觉偏好,拥有清晰的模块分区和柔和的学术配色,甚至不输人类精绘的参考图。
PaperBanana 还有一个杀手锏,它支持风格润色模式,即便你只画了一个简陋的草图,它也能基于这套审美指南,将其重绘为精美的矢量风格插图。
![图片[27]-学术特供版Nano Banana来了!Google亲自下场,直接对齐NeurIPS审美-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/02/20260205183408847-1770287648-f9443d4f56efd07d809e41f097158253.png)
它也能直接对现有的手绘示意图进行审美升级:
![图片[28]-学术特供版Nano Banana来了!Google亲自下场,直接对齐NeurIPS审美-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/02/20260205183410758-1770287650-7f7f4ca9049af48a528f6f524fe70ce6.jpeg)
![图片[29]-学术特供版Nano Banana来了!Google亲自下场,直接对齐NeurIPS审美-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/01/20260105005251987-1767545571-c2a2998abe52b7d29a6255e80d85631c-scaled.png)
不仅要画得好看,关键得画对
为了客观评估生成质量,团队构建了一个包含 292 个 NeurIPS 2025 真实案例的基准测试集 PaperBananaBench。
![图片[39]-学术特供版Nano Banana来了!Google亲自下场,直接对齐NeurIPS审美-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/02/20260205183411402-1770287651-3d1b8ae8aa73cbe0188540cb01145b87.png)
评测结果显示,PaperBanana 在忠实度、简洁性、可读性和美观度上均全面优于基线模型。
尤其是因为有审查智能体把关,忠实度相比原始模型提升了 2.8%;在简洁性上更是大幅提升了 37.2%,有效解决了生成模型常有的视觉噪点问题。
在人工评测中,PaperBanana 生成的统计图在美观度上甚至微弱击败了原论文的人类作者。
![图片[40]-学术特供版Nano Banana来了!Google亲自下场,直接对齐NeurIPS审美-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/02/20260205183412855-1770287652-c29c9a6b083d1aa41c78a6a163ed9a85.png)
不过,PaperBanana 目前也并非全能。它生成的架构图本质上仍是位图,无法像 SVG 那样无损编辑。
此外,在处理极度复杂的网络拓扑时,模型偶尔仍会出现连线冗余或节点匹配错误。
![图片[41]-学术特供版Nano Banana来了!Google亲自下场,直接对齐NeurIPS审美-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/02/20260205183412751-1770287652-853d0778e1e652cb86c2e2b9c8d76b30.png)
![图片[42]-学术特供版Nano Banana来了!Google亲自下场,直接对齐NeurIPS审美-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/01/20260105005253576-1767545573-ce5aff2159ba07f7ac3282811c4f98cb-scaled.png)
结语
据 GitHub 项目主页显示,该项目的核心代码和数据集预计将在 2 周后正式开源。
PaperBanana 的核心价值很简单,把大家从低效的绘图劳动中解放出来。
等代码放出后,大家不妨试一试——毕竟,把时间花在 idea 上,总比花在对齐像素上划算。
🔍
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
![图片[60]-学术特供版Nano Banana来了!Google亲自下场,直接对齐NeurIPS审美-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/02/20260205183414635-1770287654-d178736af92cc0d54c26d3519ef28e17.jpeg)
<原文链接:https://mp.weixin.qq.com/s/Eav287iHkR2rcZctNduHwA


















暂无评论内容