最新发布第85页
排序
视频生成进入“全能”时代:昆仑万维SkyReels-V3开源,覆盖参考图像转视频、视频延长、音频驱动虚拟形象三大核心能力
1月29日,Skywork AI正式开源自研视频生成模型SkyReels-V3。作为一系列多模态视频生成模型,该系列支持参考图像转视频(Reference Images-to-Video)、视频延长(Video Extension)和音频驱动虚...
刚刚,DeepSeek 开源 OCR 2:让 AI 像人一样「阅读」,准确率 91%!
DeepSeek 开源 OCR 2,用「视觉因果流」让 AI 像人一样阅读文档。OmniDocBench v1.5 准确率 91.09%,代码、模型、论文全开源。











