最新发布第17页
排序
大模型拿金牌却输给三岁宝宝!一套「纯视觉考卷」把顶尖VLM打回幼儿园
新智元报道 编辑:定慧 【新智元导读】大模型能写代码、解奥数,却连幼儿园小班都考不过?简单的连线找垃圾桶、数积木,人类一眼即知,AI却因为无法用语言「描述」视觉信息而集体翻车。...
用Gemini 3 精准控图法(附Prompt)
P3是生成的JSON描述图片,P4是通过JSON描述修改等到的图,P5是原图x0ax0a步骤:(就两步效果炸裂)x0a第一步,图给Gemini,要求它用JSON描述图片x0a第二步,直接修改JSON里的关键词,出图 x0ax0...
刚刚,DeepSeek 开源 OCR 2:让 AI 像人一样「阅读」,准确率 91%!
DeepSeek 开源 OCR 2,用「视觉因果流」让 AI 像人一样阅读文档。OmniDocBench v1.5 准确率 91.09%,代码、模型、论文全开源。
还在熬夜赶PPT?谷歌用4分钟,就把我们以前4小时的活干没了
昨天晚上试了 NotebookLM 最新的Slide Deck功能,把一份35页的《2025前端性能优化报告》(PDF + 几篇论文 + 3个网页链接)直接丢进去,3分48秒后,就吐出一套36页的完整演示稿











