C
ChaoBro

Pixelle-Video:开源 AI 全自动短视频引擎,从脚本到成片一站式生成

Pixelle-Video:开源 AI 全自动短视频引擎,从脚本到成片一站式生成

Pixelle-Video(github.com/AIDC-AI/Pixelle-Video)是一个开源的 AI 全自动短视频引擎,定位为从文本脚本到视频成片的一站式自动化解决方案。该项目已获得 7600 星标和 1200+ Fork,332 次提交,最近两周内仍在活跃更新。

它能做什么

Pixelle-Video 的核心工作流覆盖了短视频制作的完整链路:

  • 脚本生成:输入主题,自动生成短视频脚本和分镜
  • 数字人播报:支持 AI 数字人生成,自动匹配口型和表情
  • 图生视频:将静态图片转化为动态视频片段
  • 动作迁移:将参考视频中的动作迁移到数字人或角色上
  • BGM 与字幕:自动配乐、生成并嵌入字幕
  • 模板系统:提供多套预设模板,降低使用门槛

项目包含 Web 界面(web/ 目录),支持浏览器操作。同时提供 API 接口(api/ 目录)和工作流引擎(workflows/ 目录),支持与其他系统集成。

技术栈

项目使用 Playwright 方案进行页面渲染(最近的提交 替换html2image为playwright方案),相比传统的 html2image 方案能更好地处理动态内容和交互效果。支持 GitHub Actions 自动化部署,并提供 Windows 打包方案(packaging/windows/)。

与同类方案对比

方案 类型 部署方式 自动化程度 成本
Pixelle-Video 开源项目 本地/自托管 全流程自动化 算力成本
HeyGen 商业 SaaS 云端 部分自动化 订阅制
Runway Gen-3 商业 SaaS 云端 生成单片段 按量计费
剪映/CapCut 商业工具 桌面/移动端 半自动化 免费/付费功能

Pixelle-Video 的独特价值在于全流程开源可部署。对于需要批量生产短视频的团队(如 MCN、自媒体矩阵),本地部署可以显著降低长期成本。但对于偶尔制作视频的个人用户,商业 SaaS 工具可能更便捷。

快速上手

# 克隆项目
git clone https://github.com/AIDC-AI/Pixelle-Video.git
cd Pixelle-Video

# 安装依赖
pip install -r requirements.txt

# 启动 Web 界面
python -m pixelle_video.web

# 或通过 API 调用
python -m pixelle_video.api

项目需要配置相关的 AI 模型服务(如数字人生成所需的 TTS 和唇形同步模型),具体依赖请参考 docs/ 目录下的文档。

适用场景

  • 自媒体矩阵的批量视频生产
  • 教育培训内容的自动化制作
  • 产品介绍的快速生成
  • 多语言版本的视频本地化(同一脚本配不同语言播报)

主要来源