最新发布第119页
排序
医疗AI迎来大考!南洋理工发布首个LLM电子病历处理评测 | AAAI'26
南洋理工大学研究人员构建了EHRStruct基准,用于评测LLM处理结构化电子病历的能力。该基准涵盖11项核心任务,包含2200个样本,按临床场景、认知层级和功能类别组织。
怎样的AI企业,最“吸金”
大家都知道我今年特别关注人工智能赛道。2月以来,我去了很多机器人企业,也参观了很多灯塔工厂中AI在产业层面的应用。那么从创业视角来讲,今天风投市场的很多资金也尤其关注人工智能赛道。一...
AI编码工具变 “格式化神器”?Claude CLI半年频当“系统杀手”,多位开发者痛斥:心血都没了!
Claude 又闯祸了。近日,一则 Reddit 上对 Claude CLI 的控诉帖引起了大量反响。
会议软件Zoom也来搞AI了,称在AI最难考试上“击败”了Gemini 3
12 月 10 日,视频会议软件公司 Zoom 发布了一条出人意料的消息:他们宣称在“人类最后的考试”(Humanity s Last Exam,简称 HLE)这个号称当前 AI 领域最具挑战性的基准测试上,
Anthropic重磅新研究:当AI采访了1250人,它看见了人类的「职业软肋」
新智元报道 编辑:倾倾 【新智元导读】AI不仅能回答问题,还能采访人类了。Anthropic让模型与1250名真实用户深度对话,自动写提纲、追问、做聚类分析,最后画出一张「人类情绪雷达图」。...










