首页 > 其他分享 >Sora效果一览为快!(超多AI视频效果)

Sora效果一览为快!(超多AI视频效果)

时间:2024-12-22 17:29:24浏览次数:5  
标签:视频 Transformer 训练 AI 生成 Sora 超多 标注

先看效果:

<iframe allowfullscreen="true" data-mediaembed="csdn" frameborder="0" id="mAGnw0hd-1734852144731" src="https://live.csdn.net/v/embed/440093"></iframe>

是不是可以以假乱真的程度了!哈哈哈

后面还准备了非常多Sora生成视频,不过先别急,在看之前我们先简单的了解一下Sora。

sora是什么?

我们来看官方的技术文档:

官方给出的解释是:作为世界模拟器的视频生成模型 。

报告里讲述了Sora模型的技术原理,他们使用了一种名为Transformer的架构来处理视频。

 

完整的技术报告很长,里面涉及非常多的专业名称,什么时间补丁啦,重标注技术啦,我把英文原版链接放在最后了,如果你感兴趣的话可以去看下完整版。

总结了一下,主要是以下四个步骤:

1、通过收集大量的视频标注获得其中的数据

2、对标注的数据进行模型训练

3、通过获取随机噪声数据进行扩散模型训练

4、去除噪音,循环采样观察去噪音的结果数据是否符合要求。

如果还是不太理解的话,我就简单打个比方,

比如你要画一幅海景画,

那先去网上搜搜海景长什么样,获取一些信息比如知道颜色用蓝色白色为主,海浪大概是什么形状(标注数据,训练数据),然后先随意的把蓝色和白色颜料泼洒在画布上,随机画一个初步的海浪形状(输入噪声进行扩散训练),然后对比客户给你的要求比如“惊涛骇浪”,浪花应该画的很大,然后再重新完善这幅画,不断循环往复(不断采样,循环训练),直到与客户描述一致时输出结果。

【这个比方只是想帮助大家理解Sora的视频生成原理,真正的训练过程肯定要比这个复杂上一万倍,如果感兴趣可以去看看Transformer框架和Diffusion Model,看看Transformer的注意力机制和扩散模型的去噪声原理】

如果您对Sora视频的魔力感到好奇,也许您的朋友也会。不妨分享给他们,咱们一起探索视频的新世界。

 好啦,通过以上内容希望你对Sora的技术已经有了一个大致的了解啦,

接下来就让我们看看Sora生成的效果吧~

以下视频均由Sora生成:

一幅宁静而又超凡脱俗的场景以高分辨率的数字清晰度展现出来,捕捉到了黄昏时分简约的海滩,穿着时尚的人躺在用精致芦苇编织的漂浮椅上,漂浮在温柔的海浪之上;海洋散发出飘渺的烟雾粒子,这些粒子升起并在空中形成抽象的图案;水中的生物发光浮游生物发出柔和的光芒,当椅子沿着海岸线轻松漂流时,用神奇的光芒照亮了整个场景。镜头色彩柔和,色调朴实。这段镜头看起来像是来自 20 世纪 70 年代的自然纪录片。

<iframe allowfullscreen="true" data-mediaembed="csdn" frameborder="0" id="Ft9BoZ9W-1734853339595" src="https://live.csdn.net/v/embed/439962"></iframe>

五只宇航犬漂浮在宇宙飞船中,凝视着无边无际的太空。它们穿着带有美国徽章和美国宇航局标志的白色宇航服,头盔用带子固定。在背景中,可以看到行星和卫星,它们的颜色在宇宙的深蓝色映衬下显得充满活力。前景中的电影画面给人一种高科技和未来主义的旅程的印象,仿佛这些狗正在执行探索未知的任务。

<iframe allowfullscreen="true" data-mediaembed="csdn" frameborder="0" id="SaEeFvNU-1734854885602" src="https://live.csdn.net/v/embed/439952"></iframe>

在水母上添加活动眼珠。

<iframe allowfullscreen="true" data-mediaembed="csdn" frameborder="0" id="ymuISQ2L-1734759468231" src="https://live.csdn.net/v/embed/439943"></iframe>

在水中游动的熊猫鸭

<iframe allowfullscreen="true" data-mediaembed="csdn" frameborder="0" id="8rzFqlOt-1734854739616" src="https://live.csdn.net/v/embed/440108"></iframe>

佛像上的天堂鸟

<iframe allowfullscreen="true" data-mediaembed="csdn" frameborder="0" id="ApRNdxAk-1734853317350" src="https://live.csdn.net/v/embed/439950"></iframe>

冬日的日本集市

<iframe allowfullscreen="true" data-mediaembed="csdn" frameborder="0" id="MyK7iGvn-1734855810317" src="https://live.csdn.net/v/embed/439953"></iframe>

科技兔子的房间

<iframe allowfullscreen="true" data-mediaembed="csdn" frameborder="0" id="oDq4gQwv-1734853306736" src="https://live.csdn.net/v/embed/439961"></iframe>

一株植物和他的朋友们的动画黏土动画视频。

<iframe allowfullscreen="true" data-mediaembed="csdn" frameborder="0" id="wz6CTrlf-1734854667622" src="https://live.csdn.net/v/embed/439951"></iframe>

<iframe allowfullscreen="true" data-mediaembed="csdn" frameborder="0" id="8K0YLRwv-1734855928237" src="https://live.csdn.net/v/embed/439958"></iframe>

<iframe allowfullscreen="true" data-mediaembed="csdn" frameborder="0" id="eLjcp5wa-1734855724817" src="https://live.csdn.net/v/embed/439957"></iframe>

<iframe allowfullscreen="true" data-mediaembed="csdn" frameborder="0" id="nx4QWYYd-1734853532254" src="https://live.csdn.net/v/embed/439960"></iframe>

<iframe allowfullscreen="true" data-mediaembed="csdn" frameborder="0" id="XNtSChSe-1734854634312" src="https://live.csdn.net/v/embed/439956"></iframe>

<iframe allowfullscreen="true" data-mediaembed="csdn" frameborder="0" id="i0IPpbse-1734853293044" src="https://live.csdn.net/v/embed/439949"></iframe>

<iframe allowfullscreen="true" data-mediaembed="csdn" frameborder="0" id="VNPCInwq-1734857419220" src="https://live.csdn.net/v/embed/440119"></iframe>

<iframe allowfullscreen="true" data-mediaembed="csdn" frameborder="0" id="TyZFtY5y-1734855860364" src="https://live.csdn.net/v/embed/439954"></iframe>

<iframe allowfullscreen="true" data-mediaembed="csdn" frameborder="0" id="89puHVMG-1734853563121" src="https://live.csdn.net/v/embed/439959"></iframe>

<iframe allowfullscreen="true" data-mediaembed="csdn" frameborder="0" id="r9pfeXJS-1734854793486" src="https://live.csdn.net/v/embed/440105"></iframe>

<iframe allowfullscreen="true" data-mediaembed="csdn" frameborder="0" id="amRAxnsk-1734853463554" src="https://live.csdn.net/v/embed/440100"></iframe>

<iframe allowfullscreen="true" data-mediaembed="csdn" frameborder="0" id="MaJLRlJs-1734857406227" src="https://live.csdn.net/v/embed/440120"></iframe>

<iframe allowfullscreen="true" data-mediaembed="csdn" frameborder="0" id="Obs1r66c-1734855916008" src="https://live.csdn.net/v/embed/439955"></iframe>

看完了感觉还不错吧,Sora的出现证明了人工智能领域取得的重大进步,它代表了从静态图像生成到动态视频创建的进化飞跃,Sora最有趣的方面之一是它对动作和情感的深刻理解,它擅长创建不仅动作自然,而且表现出一系列情感的角色,赋予人工智能生成的内容前所未有的深度和真实感,为内容创作和创意扩展开辟了新的可能性。

今天的分享就到这里啦,如果觉得还不错就请分享给你的朋友吧,让他们也能感受到Sora的魔力!

附: 

Sora技术文档英文原版链接:https://openai.com/index/video-generation-models-as-world-simulators/

中文版 :Sora技术报告【官方版】-CSDN博客


欢迎点赞,收藏,评论,你的鼓励就是我创作的最大动力!(๑╹◡╹)ノ"""

版权声明:本文为CSDN博主「姚梦蕾」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:Sora效果一览为快!(超多AI视频效果)-CSDN博客

标签:视频,Transformer,训练,AI,生成,Sora,超多,标注
From: https://blog.csdn.net/weixin_53310927/article/details/144596696

相关文章

  • AIGC时代算法工程师的面试秘籍(第二十八式2024.12.2-12.15) |【三年面试五年模拟】
    写在前面【三年面试五年模拟】旨在整理&挖掘AI算法工程师在实习/校招/社招时所需的干货知识点与面试经验,力求让读者在获得心仪offer的同时,增强技术基本面。欢迎大家关注Rocky的公众号:WeThinkIn欢迎大家关注Rocky的知乎:RockyDingAIGC算法工程师面试面经秘籍分享:WeThi......
  • 【原创】xenomai环境下开源实时数控系统LinuxCNC编译安装
    linuxcnc在xenomai下的构建简单记录,参考链接https://www.linuxcnc.org/docs/devel/html/code/building-linuxcnc.html1.环境软硬件环境桌面环境:Ubuntu24.04+xenomai3.3硬件:rk3588(nanoPiR6/T6)对xenomai内核要求要在使linuxcnc在xenomai上运行,内核配置Localversion必须是-......
  • AI助力生成原型与UI前端代码第一回
    应用场景代码自动生成:AI大模型可以根据设计稿或简单的描述自动生成前端代码,如HTML、CSS和JavaScript。开发者只需提供界面的草图或描述性语言,AI就能生成相应的代码。前端开发工具中的AI插件可以实现更智能的代码补全功能,不仅根据语法和变量名进行补全,还能根据项目的上下文和开发......
  • 【AI+物联网】AIOT :打造边云协同的物联网新模式
    在当今数字化浪潮中,AIOT(人工智能物联网)与边缘智能宛如一对闪耀的双子星,正以前所未有的速度重塑着各个行业,为人们的生活与生产带来翻天覆地的变革。一、AIOT:万物互联的智慧基石AIOT作为人工智能技术与物联网深度融合的结晶,为智能制造搭建起关键架构。物联网凭借多样的传感器与网......
  • CrewAI 技术总结笔记
    CrewAI技术总结笔记CrewAI是一个专注于增强AI代理协作能力的框架,旨在通过角色定制、任务管理、团队协作和流程优化,创建高效的多代理系统。此手册将全面解析CrewAI的核心概念、使用方法及其扩展功能,帮助开发者快速上手并构建复杂的AI解决方案。1.代理(Agents)1.1概......
  • 【stable diffusion原理】一文带你解读AIGC的基础StableDiffusion!
    前言StableDiffusion是一种基于扩散模型的生成式人工智能技术,由StabilityAI等团队开发。它能够根据输入的文本描述生成高质量的图像。StableDiffusion采用了潜在扩散模型(LatentDiffusionModels,LDMs),通过在潜在空间中进行操作,提高了计算效率和生成图像的质量。Sta......
  • AI绘画竟然有这些变现渠道!手把手教程来啦
    哈喽这里是海绵身为设计师的我,平时也会利用空余时间,利用信息差和AI工具做副业赚钱。(仅代表本人个人部分收益)Ai技术发展快速的时代,以下几种变现渠道,我不允许你们还不知道!一、作品变现作品变现的副业思路主要是通过AI绘画生成表情包、头像、海报、商品AI图、logo、绘本......
  • AI垃圾装满溢出识别摄像机
    AI垃圾装满溢出识别摄像机是一种基于人工智能技术的创新设备,旨在实时监测公共场所垃圾箱的装填情况,及时警示相关部门进行清理或更换,提高城市管理效率,改善城市环境质量。这种AI垃圾装满溢出识别摄像机通过搭载先进的图像识别和深度学习算法,能够准确识别垃圾箱内的垃圾填充情况。当......
  • AI人员翻越栏杆监测摄像机
    AI人员翻越栏杆监测摄像机是一种集成了人工智能技术和高清摄像功能的智能监控设备,旨在监测和预防禁止区域内的人员翻越栏杆的行为。这种先进的监测系统在城市安全管理和公共秩序维护方面发挥着关键作用,广泛应用于重要场所、敏感区域以及公共交通设施等地方。AI人员翻越栏杆监测......
  • AI客流量监测统计摄像机
    AI客流量监测统计摄像机是一种结合人工智能和摄像监控技术的创新产品,广泛应用于商场、车站、景区等场所,通过智能监测和统计客流量,提供决策支持和运营优化。这种摄像机利用先进的AI算法,能够准确地统计出进出人员、车辆等的数量和流向,实时监测场所的客流量情况。通过对客流数据的收......