DeepSeek 昨夜上新:代码能力飙升,震惊海外用户

29次阅读
没有评论

共计 1601 个字符,预计需要花费 5 分钟才能阅读完成。

【本文要点】
DeepSeek 于 2025 年 3 月 24 日发布了升级后的 DeepSeek-V3 模型,参数由 6710 亿提升至 6850 亿。新模型采用 MIT 开源协议,允许更自由的使用和商业化。测试结果显示,DeepSeek-V3 在代码、数学和文科问题上的表现有显著提升,特别是在网页开发和设计方面,能够快速生成美观且功能丰富的代码。此外,模型在针对数学问题时表现出一定的反思能力,回答变得更全面。用户对更新反响积极,期待后续的版本更新。


【正文】

新闻来源: 智东西
于 2025-03-24 18:13:49


DeepSeek 昨夜上新:代码能力飙升,震惊海外用户


智东西 3 月 25 日报道,昨日晚间,DeepSeek 在开源平台悄然上线了升级后的 DeepSeek-V3 模型。新模型的版本号为 DeepSeek-V3-0324,模型参数为 6850 亿,较早期版本的 6710 亿有小幅增长。不过,DeepSeek 尚未放出新版模型的系统卡,我们暂时无法获取关于这款模型的更多信息。

DeepSeek 昨夜上新:代码能力飙升,震惊海外用户


开源地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324 同时,DeepSeek 也将 DeepSeek-V3 模型的开源协议更新为与 DeepSeek-R1 一致的 MIT 协议,这一协议更为宽松,允许模型蒸馏、商用等行为,给了开发者更多的自主权。

新版 DeepSeek-V3 上线后,智东西第一时间进行了代码、数学和通用能力等多方面的测试,并关注到广大网友的测试结果。据众多已经体验上这款模型的网友分享,升级后的 DeepSeek-V3 在代码、数学等方面有明显的性能提升。

一位海外 AI 博主称,DeepSeek 终于能在代码领域和 Anthropic 的 Claude Sonnet 3.5 一决高下了。而之前,Claude Sonnet 3.5 在程序员圈内拥有极高的声誉,无论诸多模型在代码上的成绩如何变化,程序员依旧更青睐使用 Claude 系列模型。

DeepSeek 昨夜上新:代码能力飙升,震惊海外用户


在智东西的测试中,新版 DeepSeek-V3 在网站开发能力、UI 设计方面展现出巨大的进步,在输入“设计一个美观的个人博客网站,带有科技感,直接开发成可用网页”的提示词之后,直接获得了如下的网页效果。

新版 DeepSeek-V3 在 2 分钟的时间内交付了一个总计 400 多行代码、设计精良的网站,据其介绍,网站采用了粒子背景动画、赛博朋克 UI(霓虹光效、悬浮动画和科技感配色)等设计元素,标题使用打字机动画,按钮具备光波扩散效果。


这一网站还使用了响应式设计,能自动适配手机和桌面设备。

DeepSeek 昨夜上新:代码能力飙升,震惊海外用户


而当旧版 DeepSeek-V3 获得相同的指令时,其解决方案仅有 100 多行代码,输出的结果在审美上也不如新版的 DeepSeek-V3。

DeepSeek 昨夜上新:代码能力飙升,震惊海外用户


有网友称,这次的“小更新”比预期中的更大,改进显著,尤其是在数学方面。

DeepSeek 昨夜上新:代码能力飙升,震惊海外用户


智东西将之前实测中,曾难倒旧版 DeepSeek-V3 和 DeepSeek-R1 的一道数学题交给新版 DeepSeek-V3。这次,DeepSeek-V3 输出的 token 与原版 DeepSeek-V3 总量明显更长,单次输出达到了输出上限,在点击继续生成后,DeepSeek-V3 继续思考,但这次的答案依旧是错误的。

不过,从错误的答案中,我们也能观察到一些新的变化,如今的 DeepSeek-V3 在给出最终答案后,会进行一定程度的反思,并修改自己的解题过程。

DeepSeek 昨夜上新:代码能力飙升,震惊海外用户


而在智东西先前测试的文科类问题上,新版 DeepSeek-V3 的答案变得更为全面。智东西的测试问题为:“布须曼人喝不喝牛奶?”旧版 DeepSeek-V3 对这一问题的回答仅有三小段话,信息量不多。

DeepSeek 昨夜上新:代码能力飙升,震惊海外用户


新版 DeepSeek-V3 采用了更为结构化的回答模式,分析的内容更为全面,补充了更多的背景信息,同时生成的速度依旧比较理想。

DeepSeek 昨夜上新:代码能力飙升,震惊海外用户


这也印证了部分网友总结出来的特点:新版 DeepSeek-V3 像是 V3 与 R1 的结合体,更倾向用长输出解决问题。

DeepSeek 昨夜上新:代码能力飙升,震惊海外用户


新版 DeepSeek-V3 的发布,也让诸多网友不禁遐想:新版 V3 都来了,R2 和 V4 还会远吗?

DeepSeek 昨夜上新:代码能力飙升,震惊海外用户


【新闻来源】

正文完
 0
评论(没有评论)