在 AI 编程界的"奥林匹克"—— SWE-bench 评测中,一家来自中国的年轻团队写下了一段新历史。
芸思智能( AIYouthLab )靠着自家研发的 Vinsoo 3.0 云端 Agent,在没有任何人类干预的前提下,击败众多硅谷星创业公司,以 88.7% 的任务通过率一举夺魁。这是"国产顶尖大模型+云原生极致工程化"的一次漂亮实战检验。
这一切的背后,是 Vinsoo 和阿里云在全栈 AI (IaaS + PaaS + MaaS )层面的一次深度共建。
芸思智能 2024 年在北京清华科技园成立,核心研发团队均来自全球顶尖学府。其自主研发的以 AI 驱动的全流程开发平台 Vinsoo,能把自然语言描述的需求,直接变成能部署、能落地的完整开发成果。靠着云端多智能体(Agent)协同架构,Vinsoo 能从头到尾自动完成从需求解析、代码生成、测试验证到部署发布的整个开发流程,不需要任何人工代码。
在权威的 SWE-bench 软件工程评测基准中,集成了 Qwen3-max 模型的 Vinsoo Code 刷新了榜单 SOTA 。这个评测覆盖了 GitHub 真实 issue 修复、跨项目代码理解、复杂bug定位等核心能力,被圈内人称为 AI 软件工程的"奥林匹克竞赛"。Vinsoo Code 在最新一轮评测中,凭借自研的 Vinsoo 3.0 云端 Agent,在没有任何人工干预的情况下,以 88.7% 的成功率拿下第一名,在复杂任务处理成功率上创造了全球最好的成绩,把硅谷的一众独角兽远远甩在身后。

"这一成绩验证了我们 Agent 团队架构的先进性和 Qwen3-max 在软件工程领域的卓越性能,"芸思智能创始人殷晓玥表示,"SWE-bench 的优异表现不是偶然,而是技术深度协同的必然结果。我们证明了 AI 不仅能够理解代码,更能理解软件工程的本质逻辑。
在 SWE-bench 上拿第一,意味着AI不仅要“懂”代码,更要像资深工程师一样具备复杂的逻辑推理和长程规划能力。
Vinsoo Code 选择将阿里云 Qwen3-max 作为唯一核心底座,并非偶然。
“我们在对比了全球多家大模型后发现,Qwen3-max 在处理复杂指令、多步推理以及代码生成上的表现,已经具备了超越GPT-4等海外模型的实力。”芸思智能创始人殷晓玥表示。
作为合作的技术底座,阿里云发布的 Qwen3-max 展现了国产大模型在专业开发领域的卓越性能。Qwen3-max 拥有超过 1 万亿参数,是阿里云迄今为止最强大的模型,在代码生成和自主智能体能力方面表现尤为突出 。
在 2025 年 9 月发布后,Qwen3-max 迅速成为全球最强大的基础模型之一,尤其在处理复杂指令和自主代理任务上,其表现出的稳定性是 Vinsoo 选择其作为底层核心的关键 。相比于其他模型,Qwen3-max 在长文本 Context Window(262k token)和上下文缓存(Context Caching)方面的优化,为 Agent 团队提供了极低延迟的知识检索能力。
Vinsoo 真正想构建的,是一套能让每个人的灵感都能规模化变现的基础设施。他们通过极其硬核的降本增效,让国产大模型在应用侧的综合成本仅为海外模型的十分之一。这不仅仅是一场成本战,更是他们计划将国产 AI 智力推向全球市场的一张“入场券”。
Vinsoo 没有做简单的 API 调用,而是走了一条深度工程化驯化的路线。利用Qwen3-max 惊人的 262k 长文本窗口(Context Window)和上下文缓存技术,Vinsoo 成功让 AI Agent 在面对千万行级的超大项目时,依然能保持毫秒级的知识检索与精准理解。
这证明了:国产大模型的智力,加上极致的应用层调优,完全可以跑出世界级的效果。

架构进化:生长在阿里云基础设施上的“Agent开发团队”
Vinsoo Code 不只是一个简单的代码补全工具,而是一个“云端开发团队”。
Vinsoo将原本沉重的一线研发职能拆解为八个各司其职的智能体。其中,上下文工程师,作为大脑清洁工,专门负责对输入流进行实时摘要与冗余卸载;Agent代码智能体,则在被净化后的局部上下文中,心无旁骛地输出高纯度逻辑;像素级UI智能体,则通过分析渲染树(Render Tree),确保前端组件的视觉一致性;而测试智能体则在后台持续运行,在每一行代码合并前完成自动化单元测试。
当你输入一个需求,背后是整个Agent系统在协同工作。这些 AI Agent 具备实时交互、多工具调用、多步骤任务执行等复杂运行特性。虽然其底层仍沿用大模型推理系统的性能与架构基线,但对基础设施提出了更高要求——尤其在业务安全隔离能力、并发弹性扩缩能力以及长周期任务的状态持久化能力方面,亟需系统性优化:
-
更强的安全隔离:防止攻击者通过提示词工程诱导 Agent 执行恶意行为,例如访问敏感数据、发起网络攻击、执行恶意代码或越权操作;同时也要防范模型“幻觉”导致的高危指令(如误删根目录)。
-
更大规模的弹性:大模型驱动的智能体应用常涉及单个 Agent 循环调用工具,甚至多个 Agent 协同调用,使得资源弹性需求被显著放大。
-
长周期、多步骤、强状态的任务支持:沙箱不仅需要持久化状态,还需在成本可控的前提下高效运行。
那么,如何构建一个可靠、高效的 AI Agent 运行环境?
阿里云 ACS(Alibaba Cloud Serverless)针对 AI Agent 场景进行了系统性优化,全面升级了强安全隔离、大规模弹性和状态保持能力三大核心能力。
ACS 默认为代码、浏览器、桌面等沙箱提供强隔离的计算环境,并结合 Network Policy、Fluid 等技术,实现从运行时、存储到网络的端到端安全隔离,从根本上阻断潜在攻击路径。
ACS 新增镜像缓存加速功能,基于云盘快照技术,可实现千级 Pod 的秒级镜像加载。再结合面向用户负载特征的沙箱资源预调度策略,平台已支持高达 15,000 个沙箱/分钟 的并发弹性能力,让业务真正实现“按需用云、弹性无忧”。
ACS 即将推出沙箱状态保持能力,支持一键休眠与快速唤醒。休眠期间,CPU 与内存资源自动释放,大幅降低闲置成本;当用户再次请求时,沙箱可快速恢复至休眠前的完整内存状态,兼顾成本效率与使用体验,找到二者之间的最佳平衡点。
Vinsoo 将整个 Agent 集群部署在阿里云全栈基础设施之上:依托 ACS 提供的弹性可扩展计算资源,同时结合云安全中心与 Web 应用防火墙( WAF )构建的纵深防御体系,数据库支撑的海量数据存储与高并发访问能力,以及阿里云Elasticsearch 服务提供的毫秒级代码语义检索能力,共同构建了一个稳定、安全、高效的技术底座。这一完整的技术栈确保每个 Agent 在高并发、复杂上下文场景下都能获得稳定、低延迟的算力支持,同时保障业务数据安全、提升数据处理效率、优化代码检索体验。
目前,这套融合了 ACS 容器服务、安全防护、数据库与搜索能力的完整解决方案已在实际生产中得到充分验证:即使面对瞬时高并发、复杂任务链或长时间运行等严苛场景,平台依然能提供稳定、安全、高效的执行环境,为 Vinsoo 这类新一代智能体应用的大规模落地提供了坚实底座。
在技术架构层面,如果说多 Agent 分工协作解决的是效率问题,那么 Vinsoo 对记忆底座的重塑则从根本上解决了智能体的生存问题。为了支撑千万级的有效上下文,Vinsoo 实现了两项核心技术突破:DYCODE(对偶编码)与 COTER(拓扑调度)。
DYCODE 利用对偶映射技术将海量代码库转化为动态索引目录,使 AI 只需提取关键的映射编码(Mapping Encoding),而无需实时加载完整的原始文件,从而极大节省了显存资源。COTER 作为智能调度引擎,能够通过预测代码逻辑流的信息熵变化,动态调整记忆片段的加载与卸载权重。这种机制确保了即便面对千万行量级的项目,系统状态也能始终保持在"最低熵"的极简状态,从物理层面彻底解决了 AI 常见的上下文丢失问题。

当国产大模型遇见极致工程化,Vinsoo 与阿里云开启“一人公司”时代。
通过与阿里云的合作,Vinsoo Code 正在让“开发即应用”成为现实——从需求描述到云端一键发布,中间繁琐的数据库设计、服务器配置全部由 AI Agent 托管,全部实现了云端自动化托管与无感化处理。
技术的价值不再体现在昂贵的人力资源上,而体现在创业者对市场需求的理解和定义能力。当输入命令直接生成一个可商用的 App,人人都可以成为改变世界的人。因此,Vinsoo 的产品形态不仅重构了代码,更重构了组织的边界。Vinsoo让每一个人都能拥有通往“一人公司”时代的入场券。
对于非技术背景的创业者而言,Vinsoo 一定会大大降低创业创新的门槛:它通过AI智能体集群深度托管了后端架构、数据库设计等工程重活,实现“一句话生成”到“自动分配域名发布”的全链路闭环,将起步阶段的研发成本直接压低了一个数量级。这意味着,从灵感到落地的周期被缩短到了分钟级,个体的创造力不再被昂贵的研发成本所束缚。
“我们相信,AI不应该替代开发者,而是让开发者进化为产品的‘主理人’。”
随着 Vinsoo 3.0 的发布,一个个“超级个体”正在被释放。而阿里云全栈 AI 能力,正是这场生产力革命中最坚实的后背。
芸思智能未来将持续与阿里云保持深度合作。对芸思智能而言,与阿里云的深度合作不仅强化了技术护城河,更验证了其"AI Agent团队协同"产品理念的前瞻性。对阿里云而言,Qwen3-max 在专业开发领域的成功落地,展现了其在垂直行业应用的巨大潜力。
Vinsoo 3.0现已开放内测申请。官网链接https://aiyouthlab.com,近期将会开放大量Vinsoo全新版邀请码。
/END/
<原文链接:https://mp.weixin.qq.com/s/f6J0EZUAbMPP23lml-ThnQ














暂无评论内容