医疗AI迎来大考!南洋理工发布首个LLM电子病历处理评测 | AAAI'26
南洋理工大学研究人员构建了EHRStruct基准,用于评测LLM处理结构化电子病历的能力。该基准涵盖11项核心任务,包含2200个样本,按临床场景、认知层级和功能类别组织。
华尔街彻夜难眠!Gemini 3屠榜金融「最难考试」,AI砸了「金饭碗」?
新智元报道 编辑:KingHZ 【新智元导读】被誉为「黄金职业通行证」的人类知识堡垒,CFA考试悄然陷落。最新的推理模型不仅轻松通过了CFA三级考试,还创造了几乎满分的成绩。 AI一分钟,人...
华尔街彻夜难眠!Gemini 3屠榜金融「最难考试」,AI砸了「金饭碗」?
新智元报道 编辑:KingHZ 【新智元导读】被誉为「黄金职业通行证」的人类知识堡垒,CFA考试悄然陷落。最新的推理模型不仅轻松通过了CFA三级考试,还创造了几乎满分的成绩。 AI一分钟,人...












