智谱清影开源！

智谱清影开源！

时间：2024-08-11 16:55:32浏览次数：13

标签：视频 AI 开源 CogVideoX 清影智谱

6小时前，智谱清影开源！

原创陆再谋 AI电影共创社 2024年08月06日 09:07

引言

2024年8月6日，智谱清影（THUDM）团队宣布开源其创新的视频生成模型CogVideoX系列，这标志着视频内容创作的一个新里程碑。开源不仅促进了技术的共享和进步，也为广大开发者和研究者提供了探索和创新的平台。

CogVideoX系列模型介绍

CogVideoX是智谱清影团队开发的一系列视频生成模型，它们能够根据文本提示生成视频内容。最新开源的CogVideoX-2B模型以其强大的生成能力和较低的资源需求，为视频生成领域带来了新的活力。

开源下载链接

网址：https://github.com/THUDM/CogVideo

主要特性

Prompt Language: 英语
GPU Memory Required for Inference: 使用SAT技术时需18GB，使用diffusers时需36GB（即将优化）
GPU Memory Required for Fine-tuning: 40GB
Prompt Max Length: 226 Tokens
Video Length: 6秒
Frames Per Second: 8帧
Resolution: 720 * 480
Quantized Inference: 不支持
Multi-card Inference: 不支持

历史意义

技术创新：CogVideoX-2B的开源，代表了视频生成技术的一大步，使得生成高质量视频内容变得更加容易和高效。
资源共享：开源促进了全球开发者和研究者之间的知识共享，加速了视频生成技术的发展和应用。
社区建设：智谱清影通过开源，建立了一个活跃的开发者社区，为模型的进一步优化和创新提供了土壤。

项目结构与使用

智谱清影团队提供了详细的项目结构和使用指南，包括：

Inference: 命令行界面和Web演示，展示如何使用CogVideoX-2B生成视频。
sat: 包含SAT权重的推理和微调代码，推荐基于CogVideoX模型结构进行改进。
Tools: 包含模型转换和字幕生成等工具。

开源计划

智谱清影团队的开源计划包括：

CogVideoX模型的开源。
3D Causal VAE的开源，该技术在CogVideoX中使用。
CogVideoX模型的推理示例（CLI/Web Demo）。
CogVideoX在线体验演示（Huggingface Space）。
CogVideoX开源模型API接口示例（Huggingface）。
CogVideoX模型的微调示例（SAT/Huggingface）。
CogVideoX-Pro的开源，专为CogVideoX-2B套件设计。
发布CogVideoX技术报告。

贡献与社区

智谱清影团队欢迎社区的贡献，并提供了详细的贡献指南。社区成员可以通过贡献代码、文档、示例或反馈来参与项目的发展。

AI电影共创社清影交流社区：

https://aimoviecs.feishu.cn/wiki/VlrVwnyTJiPNs1k24ZqcqlxXnkc

结语

智谱清影的开源行动不仅为视频生成领域带来了新的技术突破，也为全球的技术社区提供了宝贵的资源和学习机会。视频生成将迎来群雄争霸的“乱纪元”，无法预估的黑天鹅事件正不断上演，生态将更加繁荣、发展更加迅猛。智谱也将成为视频生成的引领者，随着更强大的模型和工具的不断推出，我们有理由相信，视频内容创作将迎来一个全新的时代。

编辑排版AI软件：智辑AI（aizhiji.com）

AI电影共创社：国内最大的AI影视社群，社群超万人，有多名国内著名导演、编剧、影视领域教授专家学者，有200多名AIGC专家，核心成员60多名，已共创AI先导片《逍遥游》、《逍遥》，AI动画《世间哪吒》，AI宣传片《AI贵州村超》等作品。欢迎您加入，一起共学共创中国AI影视。

官方学习文档：

‌‍‌⁠‍⁠⁠‌‍‍‍⁠‬‍⁠‍‬https://aimoviecs.feishu.cn/wiki/VlFUwKlsbidJ08kxiuWc6xganFc

加入社群：目前AI电影共创社除了总社各社群，还设有北京、上海、杭州、贵阳、横店、宁波、金华、广州、成都、佛山、中山、长春、济南、长沙等区域分社群。方便您对接资源，线下交流。只要您想学习AI，都可以加入我们。

标签：视频,AI,开源,CogVideoX,清影,智谱
From： https://blog.csdn.net/sinat_37574187/article/details/140951231

DBSyncer：一款开源的数据同步中间件
dbmotiondbsyncerdatax…介绍DBSyncer（英[dbsɪŋkɜː®]，美[dbsɪŋkɜː®简称dbs）是一款开源的数据同步中间件，提供MySQL、Oracle、SqlServer、PostgreSQL、Elasticsearch(ES)、Kafka、File、SQL等同步场景。支持上传插件自定义同步转换业务，提供监控全量和增量数据统计......
YOLOv8开源揭秘：AI视觉技术在智能设备与系统全景应用
目录一、引言二、YOLOv8模型简介三、YOLOv8的功能特性四、YOLOv8应用场景五、代码示例示例一：对图像进行目标检测示例二：对视频进行目标检测示例三：批量处理图像文件夹示例四：自定义模型进行目标检测示例五：实时摄像头目标检测示例六：获取目标检测的详细信息六、结语一......
大冤种慧哥 - 10台充电桩赢利24万？【慧哥开源充电桩平台 HZCOS-chargeOS-cloud】
特别申明：仅仅代表个人观点，错的地方虚心请教学习，各位手下留情众所周知，投资一门生意能否盈利的关键就在于成本和收入。为了更好的给大家讲解投资充电桩场站这门生意是否划算，本文详细讲解、如有不足之处、请大家多多谅解。建设一处充电桩运营场站的成本和收入如下：Ⅰ主要成......
手把手教你运行Java开源框架若依RuoYi（视频教程）
很多小伙伴在学习若依框架的时候，可能会遇到项目启动失败等各种问题。于是，我抽空制作了若依各个版本的项目启动教程，希望对初学者有一定帮助！在启动若依框架的时候，需要配置好基础开发环境。JDK版本使用1.8.xMySQL版本使用5.7.xNode版本使用14.xNacos版本使用2.0.xReids......
RWKV模型详解与开源代码
RWKV模型详解目录RWKV模型详解1.背景与简介2.RWKV原理与模型介绍2.1架构2.2TokenShift2.3WKV操作符2.4输出门控2.5Transformer-like训练2.6RNN-like推理2.7额外优化3.与现有大模型对比4.开源代码(代码来自论文中的开源链接：[RWKV](https://github.com/Blink......
在线客服源码全开源搭建
在线客服系统源码全开源搭建是一个涉及多个步骤的过程，这里提供一个基本的指南来帮助你理解整个过程：需求分析：确定你需要的在线客服系统的基本功能，例如即时消息、访客追踪、聊天记录、自动回复等。选择技术栈：根据你的需求和团队的技术背景，选择合适的编程语言......
开源图片编辑器的插件化架构
大家好，我是开源图片编辑器的作者，在开发图片编辑器的过程中，因为一些功能无法扩展，出现过一次较大的重构，将整个编辑器改为了插件化的架构，经历过这次重构，规范了编辑器功能的扩展方式，解决了项目里很多重要的问题。如果你也在做类似的项目，或者对图片编辑器架构比较感兴趣，希望我的经验能......
Github 2024-08-10开源项目日报 Top10
根据GithubTrendings的统计，今日(2024-08-10统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Python项目4JavaScript项目2TypeScript项目2C#项目1Dockerfile项目1RichTextFormat项目1Swift项目1Jupyt......
开源的一键AI去除视频水印和字幕！
【大华轻创】大家好，我是大华！我们做网创的，多多少少会去下载很多视频素材，但很多素材自己觉得非常好，但有那该死的水印和字幕就让人非常不爽，要么在剪辑的时候放大把字幕拉出屏幕外，又或者是用黑框该掉字幕，这着实影响美观！有什么办法可以直接去掉字幕和水印吗？答案是有的！今天就......
《开源大模型食用指南》发布，7个小时，一杯奶茶速通大模型！
前言《开源大模型食用指南》是一个围绕开源大模型、针对国内初学者、基于AutoDL平台的中国宝宝专属大模型教程，针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导，简化开源大模型的部署、使用和应用流程，**让更多的普通学生、研究者更好地使......