首页 > 其他分享 >直播预告|Sora 会怎样驱动视频编解码领域的突破与革新

直播预告|Sora 会怎样驱动视频编解码领域的突破与革新

时间:2024-03-20 19:00:14浏览次数:21  
标签:编解码 视频 技术 直播 Sora IEEE 图像编码

 

 

 

在数字化时代,视频内容的传播与消费已成为日常生活的一部分。视频编解码技术是数字媒体领域的一项核心技术,它影响着视频质量,传输速度以及观看体验。与此同时,视频产业正在经历一场由技术驱动的变革,Sora、AIGC 等相关技术的兴起正是这场变革的关键推手。

 

本期 RTE Dev Talk,我们邀请到了 IEEE 1857.11 标准工作小组组长 刘东教授 在线分享“端到端图像编码技术与标准”,以及双深科技 CTO 武祥吉老师,声网合伙人、VP 孙雨润等大佬深入分析 Sora 技术在压缩算法、实时传输和跨平台兼容性方面的创新,以及这些技术是如何改变现有的视频编解码技术,以及影响未来的视频产业发展。

 

立即报名,和我们一同在线探讨 Sora 技术及其在视频编解码领域所带来变革的深刻理解,以及 Sora 及相关技术发展将如何塑造一个更加智能、高效的视频产业新生态。

 

时间:3 月 27 日(周三) 20:00 - 21:00形式:线上直播

活动安排 Agenda

20:00 - 20:20 主题分享:端到端图像编码技术与标准

 

20:20 - 21:00 圆桌讨论:Sora 在视频编解码领域的突破与革新

嘉宾简介

 

 

中国科学技术大学特任教授,IEEE 1857.11 标准工作小组组长

 

刘东

 

端到端图像编码技术与标准

 

个人简介:

 

刘东博士,中国科学技术大学信息科学技术学院电子工程与信息科学系特任教授、博士生导师、系副主任,获得国家自然科学基金优青项目资助。2004 年、2009 年在中国科大分别获得学士和博士学位。2009 年至 2012 年任职于诺基亚北京研究院。2012 年至今历任中国科大轨道制副教授、副教授、特任教授。研究领域为图像视频处理、编码、分析和数据挖掘。在国际期刊和会议上发表论文 200 余篇,谷歌学术总引用超过 16000 次,h 指数 50。获授权发明专利 30 余项,多项技术提案被国际国内标准组织采纳。现为 IEEE、中国计算机学会、中国图象图形学学会高级会员,IEEE 电路与系统学会多媒体系统及应用技术委员会委员,中国图象图形学学会多媒体专业委员会常务委员。任 IEEE 1857.11 标准工作小组组长,IEEE TIP 期刊副编辑等。

 

分享内容简介:

 

各种各样的应用场景中每天都在产生大量的图像数据,AIGC 的兴起更是加速了图像数据的爆发式增长。海量数据给存储和传输带来巨大压力,迫切需要图像编码技术对数据进行更高效的压缩。

 

近年来,人工智能和深度学习被运用到图像编码中,产生了端到端学习的图像编码技术,其核心思想是利用神经网络构建编码器和解码器中的计算单元,并利用率失真函数对整个网络进行整体优化。端到端图像编码技术从 2015 年起步,现在已经表现出相比传统技术的显著优势,但也提出了计算复杂度过高等挑战。国内外研究人员不断寻求更新更好的端到端图像编码技术,并合作制定了新的图像编码标准,例如 IEEE 1857.11 和 JPEG AI 等。

 

此次分享将简要介绍端到端图像编码技术的核心原理、当前水平以及相关标准的最新进展,并讨论下一步发展趋势等。

 

 

 

上海双深信息科技 CTO

 

武祥吉

 

2017 届浙江大学硕士毕业,国内最早从事 AI 编解码研究的一批人,在 CVPR2019/2020/2021 图像视频编码赛道中,获得多次世界第一。与团队一起参与制订 IEEE 1857.11 AI 端到端图像编码标准, 贡献了一项适合 NPU 并行计算的熵模型加速专利。

 

 

 

神秘嘉宾

特邀主持

 

 

RTE 开发者社区布道师

 

孙雨润

 

个人简介:

 

孙雨润,RTE 开发者社区布道师,声网合伙人兼客户成功副总裁。毕业于中国科学技术大学计算机专业,曾先后供职 YY、微软、腾讯。2014 年加入声网,是早期创业团队成员之一,目前主要关注电商/秀场/赛事/游戏/元宇宙等赛道,通过实时互动能力,推动相关场景体验提升、技术迭代、商业闭环。

 

 

 

扫码添加小助手微信,备注「0327」进活动群

 

通过本次活动,我们希望帮助各位小伙伴了解背后的技术,并且结交相同兴趣的志同道合的朋友~扫码进群,还可以和本次活动的嘉宾交流沟通哦!

合作伙伴

 

 


 

 

标签:编解码,视频,技术,直播,Sora,IEEE,图像编码
From: https://www.cnblogs.com/Agora/p/18085865

相关文章

  • GPT-4与Claude3、Gemini、Sora:AI领域的技术创新与突破
    【最新增加Claude3、Gemini、Sora、GPTs讲解及AI领域中的集中大模型的最新技术】2023年随着OpenAI开发者大会的召开,最重磅更新当属GPTs,多模态API,未来自定义专属的GPT。微软创始人比尔盖茨称ChatGPT的出现有着重大历史意义,不亚于互联网和个人电脑的问世。360创始人周鸿祎认......
  • Open Sora 发布!开源的高效复现类 Sora 视频生成方案
    不久前OpenAISora的发布可以说是震惊了世界,但是奈何目前OpenAI还未将Sora开放公测,但在昨天,我们却等来了OpenSora1.0的发布,这是Colossal-AI团队的一个完全开源的视频生成项目,致力于高效制作高质量视频,并使所有人都能使用其模型、工具和内容的计划。通过采用开......
  • GPT-4席卷全球,Claude3、Gemini、Sora如何应战?
    【最新增加Claude3、Gemini、Sora、GPTs讲解及AI领域中的集中大模型的最新技术】2023年随着OpenAI开发者大会的召开,最重磅更新当属GPTs,多模态API,未来自定义专属的GPT。微软创始人比尔盖茨称ChatGPT的出现有着重大历史意义,不亚于互联网和个人电脑的问世。360创始人周鸿祎认......
  • 直播预约丨《袋鼠云大数据实操指南》No.1:从理论到实践,离线开发全流程解析
    近年来,新质生产力、数据要素及数据资产入表等新兴概念犹如一股强劲的浪潮,持续冲击并革新着企业数字化转型的观念视野,昭示着一个以数据为核心驱动力的新时代正稳步启幕。面对这些引领经济转型的新兴概念,为了更好地服务于客户并提供切实可行的实践指导,自3月20日起,袋鼠云将推出全新......
  • 没等来OpenAI,等来了Open-Sora全面开源
      ChatGPT狂飙160天,世界已经不是之前的样子。新建了人工智能中文站https://ai.weoknow.com每天给大家更新可用的国内可用chatGPT资源​ 发布在https://it.weoknow.com不久前OpenAISora以其惊人的视频生成效果迅速走红,在一众文生视频模型中突出重围,成为全球瞩目的焦......
  • AI新工具 终于来了! 华丽的风格转移! ;基于视频/网络摄像头的 AI 运动捕捉应用,可用于虚拟
    ✨1:MagnificAI终于来了!......
  • OpenAI Sora训练数据非法?&ChatGPT参数规模被扒?
    关注文章底部公众号,获取更多AI新闻资讯Sora训练数据被质疑非法训练AI模型数据所面临的巨大版权争议,是这一年多全球相关人士讨论最多的话题。近日OpenAICTOMurati接受采访时,被问及Sora训练数据来源时语焉不详、支支吾吾,已经成了全网热议的话题。女记者:「Sora是用什么数......
  • Sora提示词与视频创作的融合(三):风格塑造:通过提示词实现视频风格的多样化
            在Sora模型中,风格塑造是赋予视频独特魅力和个性的关键步骤。通过巧妙地运用提示词,创作者可以实现视频风格的多样化,从而创作出各具特色的视频作品。下面将详细探讨如何利用提示词进行风格塑造,并提供一些实际的应用方法和建议。一、理解视频风格的重要性视频......
  • 2024年全球电商直播深度研究报告
    环洋市场咨询(GlobalInfoResearch)的电商直播市场调研报告提供电商直播市场的基本概况,包括定义,分类,应用和产业链结构,同时还讨论发展政策和计划以及制造流程和成本结构,分析电商直播市场的发展现状与未来市场趋势,并从生产与消费两个角度来分析电商直播市场的主要生产地区、主要消......
  • 深度解析Sora视频生成原理
    在当今数字时代,视频内容已经成为人们生活中不可或缺的一部分。Sora视频生成技术的出现,为视频内容的创作和生产带来了全新的可能性。Sora是一种基于人工智能的视频生成技术,它能够以惊人的速度和精度生成高质量的视频内容,为视频制作人员提供了强大的工具。本文将深度解析Sora视频生......