全球首个能写综述的 AI 来了,据说能和博导比一比

图片图片[2]-全球首个能写综述的 AI 来了,据说能和博导比一比-AI Express News

 

每一个做过科研的人,都经历过这样的至暗时刻——

三个月、几百篇论文、无数个深夜,才换来一篇综述初稿。

你也许试过让 ChatGPT 帮忙。

它洋洋洒洒写了好几页,看上去结构完整、逻辑清晰。

当你去核查参考文献时,却发现那些论文根本不存在——标题像真的,作者像真的,就是查不到。

AI 在一本正经地「编故事」。

今年 2 月,Nature 发表了一项研究,试图给这个问题提供一个答案——全球首个专为科学综述写作设计的开源 AI 模型 OpenScholar 诞生了。

没有 AI 之前,写综述堪比西天取经

全球每年发表数百万篇论文,即便是不眠不休的科研工作者,也不可能追踪自己领域内的全部进展。

撰写一篇严谨的综述,往往需要数月甚至一年。

从检索文献、筛选、精读、归纳到成文,每一步都高度依赖人工投入,效率极低。

更关键的是,综述对「引用」的要求极为严格——不仅要找到相关论文,还必须确保每一个论点都有确凿文献支撑,且引用内容真实存在、准确无误。

 

正因如此,综述写作借助 AI 必能事半功倍。

OpenScholar,正是在这样的背景下诞生。

它是全球首个专为科学文献综合设计的完全开源检索增强模型(RAG)。

 

图片图片[2]-全球首个能写综述的 AI 来了,据说能和博导比一比-AI Express News

图源:Nature

 

它的「强大」,体现在四个方面:

  • 超大规模科学文献库:收录 4500 万篇开放获取论文,建立了 2.36 亿段落级向量索引,是目前规模最大的开源科学数据存储库之一

  • 精准的检索能力:结合语义搜索、关键词 API 和网络学术平台三路并行,再用专门训练的重排模型筛出最相关的段落,确保每一句话都有据可查

  • 自我反思的纠错机制: 给答案前,会启动自我审查程序,如果不正确,会推倒重来,直到所有论点都有确凿证据。

  • 完全开源:无需订阅费,训练代码与 4500 万篇论文索引库全部公开,且支持本地部署,让科研数据真正掌握在研究者手中,远离泄露风险。

     

为什么通用大模型不适合写综述?

很多人会问:ChatGPT、DeepSeek 这类大模型不能直接写综述吗?

问题在于,现有的主流 AI 工具,在严谨的学术面前,有三大致命伤。

第一,学术幻觉。

当 GPT-4o 被要求引用近期文献时, 78%~90% 的引文属于虚构——论文标题看似真实,但根本不存在。即便是更新一代模型,虚构引用比例仍只有 39%。

你以为它引经据典,其实它在「脑补」。

第二,知识存在时间滞后。

通用模型的训练数据有截止日期,无法实时访问最新发表的研究成果。昨天刚发布的突破性论文,它并不知道。

第三,缺乏系统性检索能力。

如果没有外部检索增强,模型只能依赖「记忆」中的统计关联,无法覆盖足够广泛的文献范围。

结果往往是——内容看似完整,实则遗漏关键研究,系统性不足。

 

 

OpenScholar 实际表现如何?

先看综合正确率。

轻量版模型 OpenScholar-8B 的整体正确率比 GPT-4o 高出 6.1%,也领先同类专用系统 PaperQA2 5.5%,在同类工具中表现最优。

但对于综述写作而言,更关键的其实是引用准确性。

在基于评分标准的测试中,人类专家的得分比无检索能力的 GPT-4o 高出 9.6 分。

OpenScholar-8B 的表现仅比人类专家低 2.9 分,已经非常接近专业水准。

 

图片

图源:Nature

在人类盲评中,专家也明显更倾向于选择 OpenScholar 生成的答案。

在人类专家的盲评中,分别有 50.8% 和 70.0% 的情况选择了 OpenScholar-8B 与 OpenScholar-GPT-4o 的回答。

相比之下,GPT-4o 的选择比例仅为 31.9%。

OpenScholar 的回答在内容覆盖的完整性和信息展开的深度上更具优势,而这恰恰是高质量综述论文所依赖的核心能力。

图片

图源:Nature

除了性能指标,OpenScholar 在设计上也强调实际可用性。

它采用轻量级专用检索器,而非依赖超大通用模型完成检索任务,显著降低运行成本与算力消耗。

当 AI 已经能够可靠整合文献、核对引用、生成结构完整的综述时,距离撰写原创 research article 也只差真实数据这一环。

AI 正在进入论文生产的核心流程。

留给人类的核心能力,将不再是「整理信息」,而是提出真正重要的问题,并对答案负责。

 

 

<原文链接:https://mp.weixin.qq.com/s/etQtHN4mMiADf6r41DRRBA

© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享
丁香园的头像-AI Express News
评论 抢沙发

请登录后发表评论

    暂无评论内容