排序
华尔街彻夜难眠!Gemini 3屠榜金融「最难考试」,AI砸了「金饭碗」?
新智元报道 编辑:KingHZ 【新智元导读】被誉为「黄金职业通行证」的人类知识堡垒,CFA考试悄然陷落。最新的推理模型不仅轻松通过了CFA三级考试,还创造了几乎满分的成绩。 AI一分钟,人...
医疗AI迎来大考!南洋理工发布首个LLM电子病历处理评测 | AAAI'26
南洋理工大学研究人员构建了EHRStruct基准,用于评测LLM处理结构化电子病历的能力。该基准涵盖11项核心任务,包含2200个样本,按临床场景、认知层级和功能类别组织。
Skyvern开源了支持Claude、GPT-4o,让AI像人一样操作任何网站。
Skyvern 是一款基于视觉大模型的开源网页自动化工具。它摒弃了脆弱的 DOM 解析,像真人一样“看”网页,无惧页面改版。支持本地部署、可视化工作流和多种模型切换,能高效完成自动登录、填单和...
Graph RAG 深度解析:从“碎片化信息”到“关联性洞察”
本文将深入探讨 Graph RAG 如何通过“图”的结构,解决传统 RAG 最致命的“上下文碎片化”问题,以及它为何是 RAG 2.0 时代的必然演进。












