最新发布第23页
排序
医疗AI迎来大考!南洋理工发布首个LLM电子病历处理评测 | AAAI'26
南洋理工大学研究人员构建了EHRStruct基准,用于评测LLM处理结构化电子病历的能力。该基准涵盖11项核心任务,包含2200个样本,按临床场景、认知层级和功能类别组织。
通用「AI科学家」来了?Meta发布训练新范式
人工智能科学家(AI scientist)迎来新突破——x0ax0aMeta 团队及其合作者共同打造了一个不仅擅长实验执行、还精通「研究计划设计」的 AI co-scientist。x0ax0a当前语言模型(LLM) 科研辅助能...
OpenAI偷装Anthropic Skills实锤,ChatGPT、Codex已植入!开发者实测11分钟造PDF:比MCP强!
近日,不少开发者发现,OpenAI 悄悄支持了 Claude 构建的 Agent Skills 机制。目前内置了 3 个 skills:excel、word 和 pdf。











