DeepSeek 昨夜上新：代码能力飙升，震惊海外用户-AI Express News

【本文要点】
DeepSeek于2025年3月24日发布了升级后的DeepSeek-V3模型，参数由6710亿提升至6850亿。新模型采用MIT开源协议，允许更自由的使用和商业化。测试结果显示，DeepSeek-V3在代码、数学和文科问题上的表现有显著提升，特别是在网页开发和设计方面，能够快速生成美观且功能丰富的代码。此外，模型在针对数学问题时表现出一定的反思能力，回答变得更全面。用户对更新反响积极，期待后续的版本更新。

【正文】

新闻来源: 智东西
于 2025-03-24 18:13:49

智东西3月25日报道，昨日晚间，DeepSeek在开源平台悄然上线了升级后的DeepSeek-V3模型。新模型的版本号为DeepSeek-V3-0324，模型参数为6850亿，较早期版本的6710亿有小幅增长。不过，DeepSeek尚未放出新版模型的系统卡，我们暂时无法获取关于这款模型的更多信息。

开源地址：https://huggingface.co/deepseek-ai/DeepSeek-V3-0324同时，DeepSeek也将DeepSeek-V3模型的开源协议更新为与DeepSeek-R1一致的MIT协议，这一协议更为宽松，允许模型蒸馏、商用等行为，给了开发者更多的自主权。

新版DeepSeek-V3上线后，智东西第一时间进行了代码、数学和通用能力等多方面的测试，并关注到广大网友的测试结果。据众多已经体验上这款模型的网友分享，升级后的DeepSeek-V3在代码、数学等方面有明显的性能提升。

一位海外AI博主称，DeepSeek终于能在代码领域和Anthropic的Claude Sonnet 3.5一决高下了。而之前，Claude Sonnet 3.5在程序员圈内拥有极高的声誉，无论诸多模型在代码上的成绩如何变化，程序员依旧更青睐使用Claude系列模型。

在智东西的测试中，新版DeepSeek-V3在网站开发能力、UI设计方面展现出巨大的进步，在输入“设计一个美观的个人博客网站，带有科技感，直接开发成可用网页”的提示词之后，直接获得了如下的网页效果。

新版DeepSeek-V3在2分钟的时间内交付了一个总计400多行代码、设计精良的网站，据其介绍，网站采用了粒子背景动画、赛博朋克UI（霓虹光效、悬浮动画和科技感配色）等设计元素，标题使用打字机动画，按钮具备光波扩散效果。

这一网站还使用了响应式设计，能自动适配手机和桌面设备。

而当旧版DeepSeek-V3获得相同的指令时，其解决方案仅有100多行代码，输出的结果在审美上也不如新版的DeepSeek-V3。

有网友称，这次的“小更新”比预期中的更大，改进显著，尤其是在数学方面。

智东西将之前实测中，曾难倒旧版DeepSeek-V3和DeepSeek-R1的一道数学题交给新版DeepSeek-V3。这次，DeepSeek-V3输出的token与原版DeepSeek-V3总量明显更长，单次输出达到了输出上限，在点击继续生成后，DeepSeek-V3继续思考，但这次的答案依旧是错误的。

不过，从错误的答案中，我们也能观察到一些新的变化，如今的DeepSeek-V3在给出最终答案后，会进行一定程度的反思，并修改自己的解题过程。

而在智东西先前测试的文科类问题上，新版DeepSeek-V3的答案变得更为全面。智东西的测试问题为：“布须曼人喝不喝牛奶？”旧版DeepSeek-V3对这一问题的回答仅有三小段话，信息量不多。

新版DeepSeek-V3采用了更为结构化的回答模式，分析的内容更为全面，补充了更多的背景信息，同时生成的速度依旧比较理想。

这也印证了部分网友总结出来的特点：新版DeepSeek-V3像是V3与R1的结合体，更倾向用长输出解决问题。

新版DeepSeek-V3的发布，也让诸多网友不禁遐想：新版V3都来了，R2和V4还会远吗？

【新闻来源】

文章版权归作者所有，未经允许请勿转载。

THE END