https://github.com/SkyworkAI/SkyReels-V2 是 SkyReels V2 模型的官方开源仓库页面,由 Skywork AI Lab 发布。这是一个专注于无限长度视频生成 的先进生成模型系列,据称是目前首个采用 AutoRegressive Diffusion-Forcing 架构(ARDiff) 的开源视频生成模型,并在公开可用模型中达到了最先进的性能(SOTA) 。
🧠 核心亮点
✅ 1. 模型架构创新
- AutoRegressive Diffusion-Forcing(ARDiff)架构 :
这是一种全新的扩散模型变体,支持无限长度视频生成 ,解决了传统视频生成模型在时间一致性、内容连贯性上的难题。
✅ 2. 主要模型版本与功能
模型名称 | 功能描述 | 分辨率 |
SkyReels-V2-DF-14B-720P | 支持无限长度的自回归视频生成 | 720P |
SkyReels-V2-I2V-14B-720P | 图像到视频合成(Image to Video) | 720P |
SkyReels-V1 | 首个高级开源“以人为中心”的视频基础模型 | - |
SkyReels-A1 | 可控图像动画化框架(如让静态人像动起来) | - |
SkyReels-A2 | 可控视频生成框架,可组合任意视觉元素 | - |
✅ 3. 配套工具与组件
- SkyCaptioner-V1 :用于视频内容理解与描述的视频字幕生成模型。
- Prompt Enhancer :提示词增强器,帮助提升生成效果。
- Diffusers Integration :与 Hugging Face Diffusers 生态兼容,便于快速部署和调用。
- 多GPU/单GPU推理代码 :提供完整的推理脚本,支持多种硬件配置。
📅 发布时间线(关键更新)
- 2025年4月24日 :发布 SkyReels-V2 系列 720P 版本(14B参数量)。
- 2025年4月21日 :开放推理代码、模型权重及 SkyCaptioner-V1。
- 2025年4月3日 :发布 SkyReels-A2,支持可控视频生成与视觉元素拼接。
- 2025年2月18日 :发布 SkyReels-A1(图像动画化)和 SkyReels-V1(人类为中心的视频生成)。
📁 仓库结构与资源下载
用户可通过以下方式使用该项目:
# 克隆仓库
git clone https://github.com/SkyworkAI/SkyReels-V2
cd SkyReels-V2
# 安装依赖(推荐 Python 3.10.12)
pip install -r requirements.txt
模型权重已上传至:
- Hugging Face
- 支持下载不同系列的模型,包括:
- 14B、5B、1.3B 参数模型
- 相机控制模型(Camera Director Models)
- 蒸馏优化模型(Step & Guidance Distill Model)
🎥 演示视频(部分)
仓库中提供了多个压缩后的演示视频(compress_demo1.mp4
, compress_demo2.mp4
, compress_demo3.mp4
),展示了模型在长视频生成、图像动画化、可控元素合成等方面的效果。
🚀 适用场景
- 视频内容创作
- 影视特效辅助生成
- 社交媒体短视频生成
- 教育、游戏、广告等行业的动态内容制作
- AI艺术创作、虚拟角色驱动等
🔗 官方链接