生成式AI
一、UniPat AI发布Echo预测智能系统,专用模型EchoZ稳居榜首
1. UniPat AI发布Echo预测智能基础设施,包含动态评测引擎、Train-on-Future训练范式和预测专用模型EchoZ-1.0,在General AI Prediction Leaderboard上以Elo 1034.2排名第一;
2. EchoZ在全部9组参数敏感性测试中均保持第一,是唯一排名未波动的模型,且在政治治理领域对人类预测者胜率达63.2%;
3. 该系统通过动态排行榜、实盘市场对照和全量数据公开三重验证机制,构建了可追溯的预测评估体系,计划推出AI原生预测API。
https://mp.weixin.qq.com/s/m0oPXIfYkRwSzhAarhlJMQ
二、Midjourney工程师开源Pretext,15KB实现网页排版提速超千倍
1. Midjourney前端工程师Cheng Lou开源Pretext项目,用纯TypeScript在用户态自研高精度文本测量引擎,绕过DOM渲染机制,通过canvas.measureText()实现布局计算;
2. 性能测试显示Chrome上排版速度提升483倍,Safari上提升1242倍,可在120fps下处理数十万文本框的滚动与缩放,三大浏览器7680项穷举测试全部像素级吻合;
3. 项目GitHub星标迅速突破11K,开发者社区涌现大量创意应用,包括文字内嵌动画、游戏渲染等,预示网页UI向Canvas/GPU渲染时代迈进。
https://mp.weixin.qq.com/s/vInXHKIjVQGpZbc9z5yAmA
三、微软开源VibeVoice语音AI模型,支持60分钟长音频单次处理
1. 微软开源VibeVoice-ASR语音识别模型(7B参数),可单次处理60分钟连续音频,支持说话人分离、时间戳标注和自定义热词识别;
2. 模型支持50多种语言自动识别,原生支持中英混合等代码切换场景,在MLC-Challenge数据集上英语WER为7.99,整体平均约12;
3. TTS部分因滥用风险已被官方移除,ASR部分支持LoRA微调,需NVIDIA GPU运行,仅供研究用途,不建议商业使用。
https://mp.weixin.qq.com/s/xYsckp1apA7oEsV7zNFArw
四、阿里发布Qwen3.5-Omni全模态模型,取得215项SOTA成绩
1. 通义实验室发布Qwen3.5-Omni,支持文本、图片、音频及音视频输入,在音频和音视频理解、推理、对话、翻译等任务上取得SOTA;
2. 模型自然涌现Audio-Visual Vibe Coding能力,可根据音视频指令直接生成可运行代码,支持语义打断、音色克隆和语音控制等实时交互功能;
3. 采用升级版Thinker-Talker架构搭配Hybrid-Attention MoE,支持256K超长上下文和113种语言识别,可处理10小时音频或1小时视频。
https://mp.weixin.qq.com/s/or9knvrcnxqJIY2cqoT71w
五、企业微信正式开源CLI,支持多家AI Agent可调用7大办公能力
1. 企业微信CLI开源项目上架GitHub,支持Claude Code、Codex等主流AI Agent,开放消息、通讯录、文档、智能表格、日程、会议和待办7大核心能力;
2. 优先面向10人及以下小团队,CLI模式让AI无需解析复杂接口文档即可围绕任务目标拆解执行,降低开发门槛和Token使用成本;
3. 开发者仅需3步即可接入:创建机器人获取配置、安装CLI和SKILL、调用能力,标志着企业微信从"给人用"转向"可被AI调用"。
https://mp.weixin.qq.com/s/69XTvO3pacuIxXhyQbe_Dw
六、PixVerse发布V6视频模型,生成速度与性价比保持行业领先
1. 爱诗科技(PixVerse)上线V6视频模型及实时世界模型R1,1080P视频几十秒即可生成,在仿真性、物理规律、电影质感等方面均有提升;
2. 新增Team Plan协同功能,支持2至15人团队共享积分池、角色权限管理和资产同步,面向AI视频工作室场景;
3. 作为AI视频赛道早期"御三家"中唯一持续迭代的产品,PixVerse穿越行业周期保持在第一梯队,凭借快速和高性价比形成差异化优势。
https://mp.weixin.qq.com/s/RWruLrlbik8zbbiyHL13NQ
前沿科技
七、港科大团队推出AI气味戒指,通过皮肤代谢气味识别健康状态
1. 香港科技大学等团队在Nature Communications发表研究,推出基于微型嗅觉传感芯片的AI可穿戴戒指,核心传感器面积仅0.0081平方毫米,可非侵入式读取饮食和活动状态;
2. 戒指能准确识别六类饮食和三种运动状态,KNN分类准确率达98.2%,还可定量预测酒精摄入量,通过蓝牙连接手机提供个性化健康建议;
3. 采用三维垂直异质界面纳米管结构耦合AA-sLSTM算法框架,未来可拓展至糖尿病、肝病等疾病的早期筛查,为下一代数字化健康监测提供新方向。
https://mp.weixin.qq.com/s/6vOvS7zz7hIWELbQD56cEQ
报告观点
八、Claude Code创始人分享15个高频使用但常被忽略的实用功能
1. Boris Cherny推荐移动端App写代码、/teleport跨设备无缝切换、/loop和/schedule自动化运行等功能,其中/loop支持按时间间隔自动执行任务最长一周;
2. 开发效率类功能包括hooks生命周期控制、git worktrees并行开发(可同时运行数十个实例)、/batch并行分发大规模变更,以及--bare参数提升SDK启动速度最多10倍;
3. 交互体验类功能包括/btw不打断主流程提问、/voice语音输入写代码、Chrome扩展验证前端输出,以及Cowork Dispatch远程控制等日常高频使用的工具。
https://mp.weixin.qq.com/s/gqfNVAMqM_MwAAjkAkRgzQ
👇加入AGI数据库,AI智能问答
![图片[1]-腾讯研究院AI速递 20260331-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/10/ba0b11144103938c1b8af70ae02ab732.png)
👇订阅下方合集,获取每日推送
<原文链接:https://mp.weixin.qq.com/s/2LPcx2O97rr3BDQBhJAkxA
















暂无评论内容