最新发布第137页
排序
医疗AI迎来大考!南洋理工发布首个LLM电子病历处理评测 | AAAI'26
南洋理工大学研究人员构建了EHRStruct基准,用于评测LLM处理结构化电子病历的能力。该基准涵盖11项核心任务,包含2200个样本,按临床场景、认知层级和功能类别组织。
Skyvern开源了支持Claude、GPT-4o,让AI像人一样操作任何网站。
Skyvern 是一款基于视觉大模型的开源网页自动化工具。它摒弃了脆弱的 DOM 解析,像真人一样“看”网页,无惧页面改版。支持本地部署、可视化工作流和多种模型切换,能高效完成自动登录、填单和...
Graph RAG 深度解析:从“碎片化信息”到“关联性洞察”
本文将深入探讨 Graph RAG 如何通过“图”的结构,解决传统 RAG 最致命的“上下文碎片化”问题,以及它为何是 RAG 2.0 时代的必然演进。
AI编码工具变 “格式化神器”?Claude CLI半年频当“系统杀手”,多位开发者痛斥:心血都没了!
Claude 又闯祸了。近日,一则 Reddit 上对 Claude CLI 的控诉帖引起了大量反响。
Anthropic重磅新研究:当AI采访了1250人,它看见了人类的「职业软肋」
新智元报道 编辑:倾倾 【新智元导读】AI不仅能回答问题,还能采访人类了。Anthropic让模型与1250名真实用户深度对话,自动写提纲、追问、做聚类分析,最后画出一张「人类情绪雷达图」。...











