最新发布第33页
排序
教AI编程作弊,它却想统治世界?Anthropic首曝「人格选择模型」
新智元报道 编辑:元宇 【新智元导读】刚刚,Anthropic曝光了「人格选择模型」:整日与我们对话的贴心AI助手,更像是大模型扮演的一个角色,而角色面具背后究竟由谁「掌舵」,仍是一个开...
AI两天推翻20年工作习惯!Karpathy百行代码开源项目“封神”,AI替你通宵肝研究、战绩可查
近日,特斯拉前 AI 总监、OpenAI 创始成员 Andrej Karpathy 最近开源了一个叫 autoresearch 的项目
重磅研究:只需 250 个文档,就能给任何大模型投毒
【摘要】一项研究揭示,利用少量样本即可对大型语言模型进行数据投毒,攻击成功率与投毒文档数量有关,而非其比例。这项发现挑战了以往对AI安全的固有认识,提示我们需加强对训练数据的监控和防...











