最新发布第189页
排序
Anthropic万字长文:一篇AI Agent评估体系的详细解析!
Datawhale干货 作者:Anthropic团队,来源:PaperAgent Anthropic发布了一篇blog《揭秘AI Agents评估》,细节满满! 原文略微有点长,整理了一张脑图,要点精髓: 良好的评估(evaluations...
清华开源!这个 GitHub 项目重新定义端侧 Agent 智能体 。
清华大学、中国人民大学、面壁智能与 OpenBMB 开源社区联合开源了一个智能体,叫做 AgentCPM,它重新定义了端侧智能体天花板。 AgentCPM 最亮眼的是以小博大。 仅 4B 参数的模型,在复杂的长...
一天两枚“代码核弹”:OpenAI 祭出首个“主打实时协作”的 Codex 模型,谷歌放出 Gemini Deep Think,码力冲到世界前8
昨晚,OpenAI 正式发布了 GPT-5.3-Codex-Spark 的研究预览版本。
为什么顶尖学者都在用“案例研究”写理论?——读Eisenhardt由案例研究构建理论
在管理学研究中,量化方法往往被视为“金标准”。我们习惯使用大样本、回归模型、结构方程去检验假设,好像只有数字才能让研究变得“科学”。











