首页 > 其他分享 >智谱清影开源!

智谱清影开源!

时间:2024-08-11 16:55:32浏览次数:13  
标签:视频 AI 开源 CogVideoX 清影 智谱

6小时前,智谱清影开源!

原创 陆再谋 AI电影共创社 2024年08月06日 09:07 

引言

2024年8月6日,智谱清影(THUDM)团队宣布开源其创新的视频生成模型CogVideoX系列,这标志着视频内容创作的一个新里程碑。开源不仅促进了技术的共享和进步,也为广大开发者和研究者提供了探索和创新的平台。

CogVideoX系列模型介绍

CogVideoX是智谱清影团队开发的一系列视频生成模型,它们能够根据文本提示生成视频内容。最新开源的CogVideoX-2B模型以其强大的生成能力和较低的资源需求,为视频生成领域带来了新的活力。

开源下载链接

网址:https://github.com/THUDM/CogVideo

主要特性

  • Prompt Language: 英语

  • GPU Memory Required for Inference: 使用SAT技术时需18GB,使用diffusers时需36GB(即将优化)

  • GPU Memory Required for Fine-tuning: 40GB

  • Prompt Max Length: 226 Tokens

  • Video Length: 6秒

  • Frames Per Second: 8帧

  • Resolution: 720 * 480

  • Quantized Inference: 不支持

  • Multi-card Inference: 不支持

历史意义

  1. 技术创新:CogVideoX-2B的开源,代表了视频生成技术的一大步,使得生成高质量视频内容变得更加容易和高效。

  2. 资源共享:开源促进了全球开发者和研究者之间的知识共享,加速了视频生成技术的发展和应用。

  3. 社区建设:智谱清影通过开源,建立了一个活跃的开发者社区,为模型的进一步优化和创新提供了土壤。

项目结构与使用

智谱清影团队提供了详细的项目结构和使用指南,包括:

  • Inference: 命令行界面和Web演示,展示如何使用CogVideoX-2B生成视频。

  • sat: 包含SAT权重的推理和微调代码,推荐基于CogVideoX模型结构进行改进。

  • Tools: 包含模型转换和字幕生成等工具。

开源计划

智谱清影团队的开源计划包括:

  • CogVideoX模型的开源。

  • 3D Causal VAE的开源,该技术在CogVideoX中使用。

  • CogVideoX模型的推理示例(CLI/Web Demo)。

  • CogVideoX在线体验演示(Huggingface Space)。

  • CogVideoX开源模型API接口示例(Huggingface)。

  • CogVideoX模型的微调示例(SAT/Huggingface)。

  • CogVideoX-Pro的开源,专为CogVideoX-2B套件设计。

  • 发布CogVideoX技术报告。

贡献与社区

智谱清影团队欢迎社区的贡献,并提供了详细的贡献指南。社区成员可以通过贡献代码、文档、示例或反馈来参与项目的发展。

AI电影共创社清影交流社区:

https://aimoviecs.feishu.cn/wiki/VlrVwnyTJiPNs1k24ZqcqlxXnkc

结语

智谱清影的开源行动不仅为视频生成领域带来了新的技术突破,也为全球的技术社区提供了宝贵的资源和学习机会。视频生成将迎来群雄争霸的“乱纪元”,无法预估的黑天鹅事件正不断上演,生态将更加繁荣、发展更加迅猛。智谱也将成为视频生成的引领者,随着更强大的模型和工具的不断推出,我们有理由相信,视频内容创作将迎来一个全新的时代。

编辑排版AI软件:智辑AI(aizhiji.com)



图片

AI电影共创社:国内最大的AI影视社群,社群超万人,有多名国内著名导演、编剧、影视领域教授专家学者,有200多名AIGC专家,核心成员60多名,已共创AI先导片《逍遥游》、《逍遥》,AI动画《世间哪吒》,AI宣传片《AI贵州村超》等作品。欢迎您加入,一起共学共创中国AI影视。

官方学习文档

‌‍‌⁠‍⁠⁠‌‍‍‍⁠‬‍⁠‍‬https://aimoviecs.feishu.cn/wiki/VlFUwKlsbidJ08kxiuWc6xganFc

加入社群:目前AI电影共创社除了总社各社群,还设有北京、上海、杭州、贵阳、横店、宁波、金华、广州、成都、佛山、中山、长春、济南、长沙等区域分社群。方便您对接资源,线下交流。只要您想学习AI,都可以加入我们。

标签:视频,AI,开源,CogVideoX,清影,智谱
From: https://blog.csdn.net/sinat_37574187/article/details/140951231

相关文章

  • DBSyncer:一款开源的数据同步中间件
    dbmotiondbsyncerdatax…介绍DBSyncer(英[dbsɪŋkɜː®],美[dbsɪŋkɜː®简称dbs)是一款开源的数据同步中间件,提供MySQL、Oracle、SqlServer、PostgreSQL、Elasticsearch(ES)、Kafka、File、SQL等同步场景。支持上传插件自定义同步转换业务,提供监控全量和增量数据统计......
  • YOLOv8开源揭秘:AI视觉技术在智能设备与系统全景应用
    目录一、引言二、YOLOv8模型简介三、YOLOv8的功能特性四、YOLOv8应用场景五、代码示例示例一:对图像进行目标检测示例二:对视频进行目标检测示例三:批量处理图像文件夹示例四:自定义模型进行目标检测示例五:实时摄像头目标检测示例六:获取目标检测的详细信息六、结语一......
  • 大冤种慧哥 - 10台充电桩赢利24万?【慧哥开源充电桩平台 HZCOS-chargeOS-cloud】
    特别申明:仅仅代表个人观点,错的地方虚心请教学习,各位手下留情众所周知,投资一门生意能否盈利的关键就在于成本和收入。为了更好的给大家讲解投资充电桩场站这门生意是否划算,本文详细讲解、如有不足之处、请大家多多谅解。建设一处充电桩运营场站的成本和收入如下:Ⅰ主要成......
  • 手把手教你运行Java开源框架若依RuoYi(视频教程)
    很多小伙伴在学习若依框架的时候,可能会遇到项目启动失败等各种问题。于是,我抽空制作了若依各个版本的项目启动教程,希望对初学者有一定帮助!在启动若依框架的时候,需要配置好基础开发环境。JDK版本使用1.8.xMySQL版本使用5.7.xNode版本使用14.xNacos版本使用2.0.xReids......
  • RWKV模型详解与开源代码
    RWKV模型详解目录RWKV模型详解1.背景与简介2.RWKV原理与模型介绍2.1架构2.2TokenShift2.3WKV操作符2.4输出门控2.5Transformer-like训练2.6RNN-like推理2.7额外优化3.与现有大模型对比4.开源代码(代码来自论文中的开源链接:[RWKV](https://github.com/Blink......
  • 在线客服源码全开源搭建
    在线客服系统源码全开源搭建是一个涉及多个步骤的过程,这里提供一个基本的指南来帮助你理解整个过程:  需求分析:确定你需要的在线客服系统的基本功能,例如即时消息、访客追踪、聊天记录、自动回复等。选择技术栈:根据你的需求和团队的技术背景,选择合适的编程语言......
  • 开源图片编辑器的插件化架构
    大家好,我是开源图片编辑器的作者,在开发图片编辑器的过程中,因为一些功能无法扩展,出现过一次较大的重构,将整个编辑器改为了插件化的架构,经历过这次重构,规范了编辑器功能的扩展方式,解决了项目里很多重要的问题。如果你也在做类似的项目,或者对图片编辑器架构比较感兴趣,希望我的经验能......
  • Github 2024-08-10开源项目日报 Top10
    根据GithubTrendings的统计,今日(2024-08-10统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下:开发语言项目数量Python项目4JavaScript项目2TypeScript项目2C#项目1Dockerfile项目1RichTextFormat项目1Swift项目1Jupyt......
  • 开源的一键AI去除视频水印和字幕!
    【大华轻创】大家好,我是大华!我们做网创的,多多少少会去下载很多视频素材,但很多素材自己觉得非常好,但有那该死的水印和字幕就让人非常不爽,要么在剪辑的时候放大把字幕拉出屏幕外,又或者是用黑框该掉字幕,这着实影响美观!有什么办法可以直接去掉字幕和水印吗?答案是有的!今天就......
  • 《开源大模型食用指南》发布,7个小时,一杯奶茶速通大模型!
    前言《开源大模型食用指南》是一个围绕开源大模型、针对国内初学者、基于AutoDL平台的中国宝宝专属大模型教程,针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导,简化开源大模型的部署、使用和应用流程,**让更多的普通学生、研究者更好地使......