最新发布第117页
排序
华尔街彻夜难眠!Gemini 3屠榜金融「最难考试」,AI砸了「金饭碗」?
新智元报道 编辑:KingHZ 【新智元导读】被誉为「黄金职业通行证」的人类知识堡垒,CFA考试悄然陷落。最新的推理模型不仅轻松通过了CFA三级考试,还创造了几乎满分的成绩。 AI一分钟,人...
医疗AI迎来大考!南洋理工发布首个LLM电子病历处理评测 | AAAI'26
南洋理工大学研究人员构建了EHRStruct基准,用于评测LLM处理结构化电子病历的能力。该基准涵盖11项核心任务,包含2200个样本,按临床场景、认知层级和功能类别组织。
怎样的AI企业,最“吸金”
大家都知道我今年特别关注人工智能赛道。2月以来,我去了很多机器人企业,也参观了很多灯塔工厂中AI在产业层面的应用。那么从创业视角来讲,今天风投市场的很多资金也尤其关注人工智能赛道。一...
AI编码工具变 “格式化神器”?Claude CLI半年频当“系统杀手”,多位开发者痛斥:心血都没了!
Claude 又闯祸了。近日,一则 Reddit 上对 Claude CLI 的控诉帖引起了大量反响。
会议软件Zoom也来搞AI了,称在AI最难考试上“击败”了Gemini 3
12 月 10 日,视频会议软件公司 Zoom 发布了一条出人意料的消息:他们宣称在“人类最后的考试”(Humanity s Last Exam,简称 HLE)这个号称当前 AI 领域最具挑战性的基准测试上,










