最新发布第18页
排序
全行业盯了两年的编程能力榜,今天退役!OpenAI 停用 SWE-bench Verified:未来标准将看 AI 能顶替多少程序员?
代码模型榜单接下来要回答的,不是“能不能再高一分”,而是“能不能真的把一部分人类工作接过去”?!
GLM-5-Turbo:龙虾增强的基座模型
我们推出GLM-5-Turbo——一个面向OpenClaw龙虾场景深度优化的基座模型。 体验过OpenClaw的用户都有一个共同感受:模型能聊好天,但未必能干好活。问题的根源不在框架,而在底层模型本身。通...
不用跟 AI 客气!新研究:语气越粗鲁回答正确率
【摘要】宾州州立大学的研究表明,给AI发命令时,越粗鲁语气回答越准确,GPT-4o正确率达84.8%。客气反而减少正确率。这是因为粗鲁表达更直接,帮助AI聚焦核心任务。











