别人在测 Demo,我已经用MiniMax M2.1跑通了整个产品开发流程

黄叔最近花了大量时间研究 Claude Agent Skills 系统,也发布了一款产品「降噪」,整个产品的数据采集和处理完全使用 Skills 构建,数据库用多维表格,我自己是比较满意的。
 
正好 MiniMax 发布了 M2.1 模型。这次更新有个让我特别感兴趣的点:多语言优化
 
啥意思呢?说实话,过去大部分模型「偏科」很严重——写前端 JS/TS 流畅好看,写 Python 脚本能跑能用,但一到 Java 后端、Go 服务、TypeScript 全栈就开始拉胯:结构不对、工程习惯不对、接口设计一塌糊涂。
 
M2.1 系统性提升了 Rust/Java/Golang/C++/Kotlin/TypeScript 等语言的能力,覆盖从底层系统到应用层开发的完整链路。这是开始理解:不同岗位写代码,到底在解决什么问题。
 
那就来真刀真枪地测一测:用 M2.1 帮我迭代「降噪」,看看生成的代码能不能直接上线生产环境!
Image

这篇文章,黄叔用自己正在开发的产品「降噪」作为测试素材,从 Skills 优化、页面样式、沉浸式交互、智能搜索 四个维度,完整测试 M2.1 的实战能力。

结论先放这里:惊喜远大于预期。

01 任务一:优化 Claude Agent Skills

黄叔现在花大量时间精力在研究 Claude 的 Skills,这是 Claude Code 里面一个非常重要的组成部分。

所以我的第一个考验,就是看 M2.1 能否帮我优化之前写的一个 Skills——这个 Skills 能够半自动化地帮我完成内容的抓取和改写工作。

Image

需要优化的是什么呢?我发现这个 Skills 对于 YouTube 视频源没有做时长过滤,导致一些 Shorts(短视频)会被错误地加载进来。希望 M2.1 能帮我把这个逻辑补齐。

Prompt:

请帮我优化这个 Skills,增加对 YouTube 视频时长的过滤,排除时长小于 60 秒的 Shorts 短视频。

Image

M2.1 不仅理解了我的需求,还:

  • ✅ 正确识别了 YouTube API 的时长字段
  • ✅ 添加了 duration 过滤逻辑
  • ✅ 保持了原有代码结构的一致性
  • ✅ 甚至还加了注释说明为什么要这样改
图片[4]-别人在测 Demo,我已经用MiniMax M2.1跑通了整个产品开发流程-AI Express News

Image

让我惊讶的是,M2.1 对于 Skills 的理解和优化能力,比过去要进化了一大截。

这个 Skills 是用 TypeScript 写的,涉及到异步处理、API 调用、数据过滤等逻辑。M2.1 不仅「写得出」,而且「写得对」——它没有用前端思维强行套后端逻辑,而是正确理解了 YouTube API 的数据结构,用合理的方式添加了过滤条件。

这种「在已有代码上精准修改」的能力,是「从 1 到 100」的 SWE-Coding 能力。像一个真正的工程师一样,读懂上下文、找到切入点、最小化改动。

国内其他模型?说实话,大部分连 Skills 是什么都理解不了,更别说在复杂的 TypeScript 工程里精准定位和修改了。

02 任务二:根据 PRD 实现页面组件

接下来测试M2.1的「从0到1」Web开发能力——能不能看懂PRD,直接生成可用的前端页面代码

我把「降噪」产品的 PRD 文档喂给它,要求生成首页的内容卡片组件。

PRD 核心需求:

┌─────────────────────────────────────────────────┐
│                                                 │
│   封面图 (16:9 比例)                            │
│                                                 │
│   ┌─────────────────────────────────────────┐   │
│   │  ● 嘉宾头像     小宇宙 ↗               │   │ ← 毛玻璃叠层
│   └─────────────────────────────────────────┘   │
├─────────────────────────────────────────────────┤
│                                                 │
│   🏷️ AI产品  🏷️ 创业访谈                       │ ← 彩色标签
│                                                 │
│   如何打造一个让人喜爱的 AI 产品                │ ← 粗体标题
│   吴恩达 · 2024年12月15日                       │ ← 次要信息
│                                                 │
│   ┃ "创业最重要的是找到真正的用户痛点,         │
│   ┃  而不是自己臆想的需求。"                    │ ← 引述金句
│                                                 │
└─────────────────────────────────────────────────┘

设计规范要求:

测试结果:

Image
Image

上面的图是线上的版本,下面的图是 M2.1 优化后的版本,一把过!可以发现毛玻璃实现的不错,配色也很清楚,有点让我吃惊!

为啥吃惊呢?过去没想到,国产模型能对细节样式的美学上面做到这个程度。

而且这是直接用在生产环境。M2.1 生成的代码结构清晰、TypeScript 类型完整、还自带响应式适配——这才是真正有「工程感」的输出,不是那种只能跑一跑、看一看的玩具代码。

03 任务三:创建沉浸式探索页

第三个任务难度升级——我要测试 M2.1 的交互动效能力。

需求是为「降噪」创建一个沉浸式的洞察卡片组件,核心交互是 3D 翻转效果:

卡片正面:
┌─────────────────────────────────────┐
│       " 金句内容 "                  │
│                                     │
│       👤 作者名字                   │
│       #标签1  #标签2                │
└─────────────────────────────────────┘

卡片背面(翻转后显示):
┌─────────────────────────────────────┐
│  原文标题(突出显示,加粗)         │
│                                     │
│  📺 来源平台                        │
│  📅 日期                            │
│                                     │
│  ┌─────────────────────────────┐    │
│  │      ▶️ 阅读完整洞察         │    │
│  └─────────────────────────────┘    │
│                                     │
│  ↗ 原视频链接                       │
└─────────────────────────────────────┘

样式规范:
卡片尺寸:320px × 384px
圆角:rounded-2xl
主色调:#FF6B35(暖橙)
背景:毛玻璃效果 backdrop-blur-xl
翻转动画:rotateY 180°,duration 0.8s

这个开发的还挺快,运行了几分钟后出来了:

Image

黄叔点评:

这个 Case 涉及到 CSS 3D Transform、状态管理、事件处理多个技术点,整个样式和交互,我还挺满意的。

特别是翻转动画转的很自然,不生硬,而是有一点弹性的,让整个交互感觉很高级。

04 任务四:智能搜索组件

最后一个任务是最复杂的——为「降噪」创建一个智能搜索功能。

# 任务:为「降噪」产品创建内容搜索功能
## 背景
「降噪」是一个 AI 行业访谈精华策展平台。首页有多张内容卡片,
包含嘉宾访谈的标题、封面、标签和金句摘要。
**用户痛点**:内容越来越多,很难快速找到「那位嘉宾」或「那个话题」。
---
## 需求(用户视角)
作为用户,我希望:
1. **搜索嘉宾名** → 看到该嘉宾的所有卡片
2. **筛选标签** → 看到带该标签的所有卡片  
3. **搜索关键词** → 看到包含该关键词的卡片
### 关键约束
- ✅ 结果直接**复用首页已有的 ContentCard 组件**
- ✅ 简单字符串匹配即可,不需要复杂算法
- ❌ 不需要匹配度百分比
- ❌ 不需要知识图谱可视化
---
## 验收标准
1. 点击首页「搜索金句」按钮,弹出搜索弹窗
2. 输入嘉宾名或选择嘉宾筛选 → 立即显示该嘉宾的卡片(与首页样式一致)
3. 选择标签筛选 → 立即显示相关卡片
4. 点击搜索结果卡片 → 跳转到内容详情页
5. 无需输入搜索词,仅设置筛选条件也应显示结果

但这恰恰说明了一个问题:真实的业务逻辑,就是比 Demo 复杂得多。搜索功能涉及到多条件组合(嘉宾 + 标签 + 关键词)、状态管理、组件复用、URL 路由……这不是写个 TodoList 能比的。

经过几轮调试后,最终效果很不错。我直接把这个功能发布到线上了——是的,现在你去访问降噪(https://aihuangshu.com/),用的就是 M2.1 帮我写的搜索功能。

Image

亮点:

  1. 1.搜索交互设计精美 —— 弹窗动画、输入框样式都很舒服
Image
  1. 2.筛选逻辑完整 —— 嘉宾筛选、标签筛选、关键词搜索都能正确工作
  2. 3.还自己加了快捷键! —— Cmd+K 可以快速打开搜索,这个我没要求,M2.1 自己加的
  3. 4.结果复用了已有的 ContentCard —— 完全按照约束来

整体的美观度和样式都非常棒,我很喜欢。

特别是快捷键这个细节,说明 M2.1 不仅能「听懂」需求,还能「想到」用户体验的优化点。这种主动性,在国产模型里很少见。

05 综合评价:M2.1 的能力边界在哪里?

经过四个任务的完整测试,总结一下 M2.1 的表现:

M2.1 的优势

  1. 1.Skills 支持领先 —— 国内模型里,M2.1 对 Claude Code Skills 的理解是最好的
  2. 2.前端审美在线 —— 毛玻璃、渐变、动效这些细节都处理得很好
  3. 3.指令遵从度高 —— 给的 PRD 约束基本都能准确执行
  4. 4.代码质量稳定 —— 执行速度还不错,有问题修复的也比较好
  5. 5.多语言工程理解力 —— 这次测试虽然主要是 TypeScript/React,但从 M2.1 的表现来看,它确实开始理解「不同场景下代码应该怎么写」。不是一套模板打天下,而是会根据上下文调整代码风格和架构。

这一点很重要。过去很多模型写 JS 还行,一写后端就变成「前端思维套后端」,生成的 Java 不像 Java 工程,Go 不像 Go 服务。M2.1 这次的多语言优化,本质上是SWE 级别的升级——不是多学了几门语法,而是开始理解不同岗位的工程习惯。

M2.1 的不足

  1. 1.复杂逻辑偶尔翻车 —— 搜索组件那个 Case 调了三四次
  2. 2.缺少视觉理解 —— 不能像 Claude那样看截图改 Bug,但官方提供了MCP

整体来说,M2.1 在 Coding Agent 场景下,目前是国产模型里的第一梯队。特别是审美和交互,我觉得现在看是断档领先了。

06 写在最后

测试完这四个任务,我最大的感受是:

MiniMax 这次是认真的。

M2.1 不是那种「跑分很高但实际不能用」的模型,而是真的能在实际项目中帮你干活的工具。

特别是对于像我这样重度使用 Claude Code 的开发者来说,M2.1 提供了一个真正可用的国产替代方案:

  • 不用魔法
  • 价格更低
  • 响应更快(国内服务器)
  • 对中文场景理解更好

当然,M2.1 还没有完全追平 Claude 4,特别是在:

  • 视觉理解(看图改代码)
  • 超长上下文的稳定性
  • 极端复杂场景的处理

但对于 90% 的日常开发任务,M2.1 已经完全够用了。

而且这次测试最让我满意的是:四个功能,全部上线了生产环境。不是跑个 Demo 截个图就完事,而是真真切切地帮我解决了产品迭代的问题。

如果你也是 Claude Code 用户,或者正在找一个能真正「干活」的国产编程模型,M2.1 值得一试。特别是如果你的项目涉及多语言协作(前端 + 后端 + 脚本),这次的多语言优化可能会给你惊喜。

这让我想起年初测试 DeepSeek R1 时的感觉——国产模型正在一步步缩小和 Claude 的差距。

也许用不了多久,我们就能完全摆脱对海外 AI 工具的依赖,真正实现 AI Coding 的「中国制造」。

原文链接:https://mp.weixin.qq.com/s/8g5KgDTb9NUaW0zUNL_emQ

© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容