首页 > 其他分享 >音视频技术开发周刊 | 238

音视频技术开发周刊 | 238

时间:2023-06-12 22:32:59浏览次数:40  
标签:视频 FFmpeg 音频 音视频 技术开发 238 图像 WebRTC


音视频技术开发周刊 | 238_人工智能

整个世界都是你的绿幕:这个视频抠图换背景的方法着实真假难辨绿幕是影视剧中抠图、换背景的利器,但如果不在绿幕前拍摄,我们还能完美地转换背景吗?华盛顿大学的研究者最近就上传了这样一份论文,不在绿幕前拍摄也能完美转换视频背景,让整个世界都变成你的绿幕。
使用边缘计算来增强流传输本次演讲将深入探讨跨多个供应商使用边缘计算平台的细节,以通过即时和全球可扩展的方法为现有媒体流实施新功能。
我们如何建立一套无参考视频质量评价体系?在实时互动无处不在的今天,视频质量是反映终端用户体验的重要指标。单纯依赖人工实施大规模的实时评估是不现实的,因此视频质量自动化评估体系的搭建与推广是大势所趋。
H264 视频文件如何缩放分辨率?前几天在知识星球里面有位朋友请教问题:如何将 H264 视频缩放分辨率?将 800x600 的 H264 文件缩放成 400x300 的,大概的流程是先解码,得到 AVFrame 后对其做缩放操作,然后再编码,得到 AVPacket 后写入文件即可。

音视频技术开发周刊 | 238_人工智能_02

基于频域卷积传递函数的盲源分离研究获得进展

音频信号的盲源分离最初是为解决“鸡尾酒会问题”发展起来,它在人机语音交互、自动会议纪要、人声和配乐分离等方面有潜在的重要应用价值。

音视频开发之旅(二)AudioRecord录制PCM音频

AndroidSDK提供了两套音频录制的API,AudioRecord和MediaRecorder。其中MediaRecorder是更加上层的API,他可以直接对手机麦克风录入的音频数据进行压缩编码(比如 mp3),并存储为文件。

移动端高性能、低延迟音频库

移动端上的很多音频场景都会有低延迟的要求,比如k歌应用,会有耳返需求。耳返主要实现监听的功能,在低延时的情况下可以给主播一个比较真实音频的反馈,技术实现上来说就是要实时地把录制进的音频数据立刻播放出去,当然这个过程要低延迟。

音视频技术开发周刊 | 238_算法_03

视频编解码芯片设计原理----06 分像素运动估计

本系列主要介绍视频编解码芯片的设计,以HEVC视频编码标准为基础,简要介绍编解码芯片的整体硬件架构设计以及各核心模块的算法优化与硬件流水线设计。

iOS AVDemo(5):音频解码,免费获得源码丨音视频工程示例

在音视频工程示例这个栏目,我们将通过拆解采集 → 编码 → 封装 → 解封装 → 解码 → 渲染流程并实现 Demo 来向大家介绍如何在 iOS/Android 平台上手音视频开发。这里是第五篇:iOS 音频解码 Demo。

音视频技术开发周刊 | 238_编程语言_04

大厂白嫖拖垮开源!开源届码农:用户脾气大需求多还不给钱

现在,开源软件界或即将到达必须变革的临界点:被大厂白嫖的既有模式不可持续,开源码农必须得到相应尊重和报偿。

龙芯FFmpeg进入5.0时代,全力支持LoongArch生态

2022年1月,FFmpeg社区正式对外发布FFmpeg 5.0版本,新版本集成了对LoongArch的生态支持和优化。本文就龙芯中科FFmpeg 5.0版本工作及规划进行系统介绍。

FFmpeg 中 AVPacket 与 AVFrame 中数据的传递与释放

这里我理解在AVFrame与AVPacket传递流转的过程中并不会去每次创建和拷贝音视频数据,音视频数据被存储在AVBuffer中,而AVFrame与AVPacket在流转时进行浅拷贝,只有调用其对应unref时,会减少AVBuffer中的引用计数,最终释放内部存储音视频数据的buffer。

一文简述FFmpeg

FFmpeg是一款开源软件,用于生成处理多媒体数据的各类库和程序。FFmpeg可以转码、处理视频和图片(调整视频、图片大小,去噪等)、打包、传输及播放视频。

FFmpeg 源码分析-转码5

本系列 以 FFmpeg4.2 源码为准,FFmpeg 源码分析系列以一条简单的命令开始,ffmpeg -i a.mp4 b.flv,分析其内部逻辑。本文主要分析 process_input_packet() 的内部逻辑。

音视频技术开发周刊 | 238_机器学习_05

WebRTC系列分享 | WebRTC视频QoS全局技术栈

WebRTC真是一套让人既爱又恨的开源代码。一方面,WebRTC里面有一套很完善很系统的QoS策略。但另一方面,WebRTC代码庞大且版本更新迭代特别快,代码的阅读和学习难度很大。为了方便大家学习了解,我们在这里对WebRTC的QoS思想及算法实现做了一些梳理总结,以系列分享的方式呈现给大家,供大家参考。

WebRTC 教程(1)

本文是 Engineering Semester 的 WebRTC 教程第一部分,主要介绍了 WebRTC 是什么,其和 Websocket 的异同,WebRTC 信令,架构和 API 入门。

音视频技术开发周刊 | 238_人工智能_06

只用一张训练图像进行图像的恢复

计算机视觉的深度学习应用往往需要大量的图像数据集,现在我告诉你,只有一张图像也可以训练,是不是非常神奇?

AI靠语意理解把照片变抽象画,无需相应数据集,只画4笔也保留神韵,有毕加索内味儿了

只用几笔,如何勾勒一只动物的简笔画,很多人从小都没整明白的问题——,如今AI也能实现了。其实AI画抽象简笔画比人更难。既要准确地理解语义,又要在几何上相似,才能让抽象画看起来有“像”的感觉。

CVPR 2022 | 惊呆了!只用一张图+相机走位,AI就能脑补周围环境!

让AI根据一个画面,就推测出后面的内容,这个感觉是不是和让AI写文章有点类似?实际上,研究人员这次用到的正是NLP领域常用的Transformer。

音视频技术开发周刊 | 238_人工智能_07

AR导航背后的秘密,你知道多少?

自打用过AR驾车导航/AR步行导航,很多小伙伴直呼黑科技真香!今天小德带大伙儿一块拆解AR导航,看看这款黑科技背后的秘密~

构建呈现二手车VR体验(上篇)

VR技术日趋成熟,元宇宙概念的大热又重新将VR相关话题搬上台面来讨论,这种新的看空间类商品方式相比传统方式更具沉浸感和互动性。58集团旗下的临感品牌作为全国领先的3D空间数字化平台自2017年起开始布局VR相关领域,今年在二手车领域中的探索得以落地。

虚拟现实技术在帕金森病冻结步态康复中的应用进展

在平衡和协调康复方面,Ding等结合强制性运动疗法原理对Nintendo Wii Fit游戏系统进行改造,构建一款基于虚拟现实的下肢平衡康复训练系统:患者双脚站在两块平衡板上,通过双脚用力,动态控制压力中心,操控虚拟人的运动。

音视频技术开发周刊 | 238_编程语言_08

浅谈单图像三维重建算法

本文简单带大家看一下单图像三维重建相关的论文。写这篇文章算是对之前的一点总结。在开始讨论之前先说一下为什么要做单图像三维重建,原因其实很直观。总结起来就是两个字,“需要”。

从4K到16K仅用一张图像训练,首个单样本超高分辨率图像合成框架来了

在这篇论文中,研究者提出了 OUR-GAN,这是首个单样本(one-shot)超高分辨率(UHR)图像合成框架,能够从单个训练图像生成具有 4K 甚至更高分辨率的非重复图像。

音视频技术开发周刊 | 238_机器学习_09

自动驾驶汽车如何解决复杂交互问题?清华联合MIT提出M2I方案

来自清华、MIT的研究团队提出了一种基于自监督学习的方法,让自动驾驶模型从已有的轨迹预测数据集中学会正确判断冲突中的礼让关系。

自动驾驶感知中的深度学习

自动驾驶是一种自主决策系统,它处理来自不同车载来源的观测流,如照相机、雷达、激光雷达、超声波传感器、GPS装置和/或惯性传感器。这些观察结果被汽车的计算机用来做驾驶决定。

万字解读自动驾驶系统中视觉感知模块的安全测试

由于深度学习系统的行为缺乏可解释性,测试基于深度学习的自动驾驶系统的安全性极具挑战性。针对基于视觉感知的自动驾驶系统,设计开发了一种场景驱动的、可解释强的、运行高效的安全性测试系统。

一文解析自动驾驶汽车决策控制系统技术

自动驾驶系统是一个集环境感知、决策控制和动作执行等功能于一体的综合系统,是充分考虑车辆与交通环境协调规划的系统,也是未来智能交通系统的重要组成部分。本文着重分析自动驾驶决策控制的相关技术,探索未来的发展方向。


标签:视频,FFmpeg,音频,音视频,技术开发,238,图像,WebRTC
From: https://blog.51cto.com/u_13530535/6466221

相关文章

  • 音视频技术开发周刊 | 237
    瘦脸、瘦腿太初级,揭秘「亚洲秘术」美颜美体特效在机器之心最新一期技术分享中,机器之心机动组以「揭秘人体美化技术」为主题,邀请到了快手、淘宝、火山引擎的技术专家,为大家解密这些特效背后的相关技术。UGC视频质量评价由于内容和质量的高度多样性,用户生成内容(UGC)的视频质量非......
  • 音视频技术开发周刊 | 230
    Opera视频出海非洲面临的技术挑战及应对Opera是一个主要业务在海外的公司。非洲地区,基础设施差,网络带宽小,人均收入低。如何在非洲地区做好视频分发传输是需要一定的市场、技术深耕。本次LiveVideoStackCon2021音视频技术大会北京站,我们邀请到了Opera的技术副总监——张建磊,为我们......
  • 音视频技术开发周刊 | 231
    面向在线教育业务的流媒体分发演进几年前,很多人对在线网课还非常陌生。随着移动设备的普及和音视频技术的发展,如今在线教育产品百花齐放。而在线教育产品能服务千万学子离不开流媒体分发技术的支撑。本次LiveVideoStackCon2021音视频技术大会北京站邀请到了网易有道研发工程师周......
  • 未来已来,音视频江湖再起波澜
    从通信为王的时代,到互联网高歌猛进的二十一世纪,音视频技术一直是众多科技公司的必备技能。一部手机联通全球各地,一个社交账号互动各国友人,已经不是什么新鲜事;就连超低延迟,超高清画质,沉浸式互动的元宇宙和全真互联,都在快速发酵,似乎马上就要被底层的摩尔定律催化过期。新鲜的应用容易......
  • 【专题介绍】音视频+
    音视频+从音视频编解码到网络传输的进一步降低时延;从智能硬件的开发到内容生产端与消费端的升级;从客户端建设到服务质量与体验的提升……音视频领域内的方方面面都在不断向前推进,助力着一个又一个行业从初生到走向成熟,或是加速转型,如:智慧医疗、工业/IoT、游戏、影视行业等等。「音......
  • 音视频PaaS的“未毕之旅”
    编者按:从思科到网易云信,从硅谷回到国内,赵加雨形容自己“爱折腾”。前有EricYuan,赵斌,后有大厂小厂纷纷入局RTC,赵加雨摩拳擦掌。2019年,拍乐云成立,拿到来自红杉中国种子基金的投资。两年多过去了,钉钉宣布收购拍乐云,又完成了一次创业的阶段性里程碑。在赵加雨看来,进入钉钉和阿里,资金......
  • 音视频PaaS的“未毕之旅”
    编者按:从思科到网易云信,从硅谷回到国内,赵加雨形容自己“爱折腾”。前有EricYuan,赵斌,后有大厂小厂纷纷入局RTC,赵加雨摩拳擦掌。2019年,拍乐云成立,拿到来自红杉中国种子基金的投资。两年多过去了,钉钉宣布收购拍乐云,又完成了一次创业的阶段性里程碑。在赵加雨看来,进入钉钉和阿里,资金、......
  • [C#] FFmpeg 音视频开发总结
    为什么选择FFmpeg?延迟低,参数可控,相关函数方便查询,是选择FFmpeg作为编解码器最主要原因,如果是处理实时流,要求低延迟,最好选择是FFmpeg。如果需要用Opencv或者C#的Emgucv这种库来处理视频流,也多是用FFmpeg做编解码然后再转换图像数据给Opencv去处理。用Opencv编解码延迟很高。其......
  • 零声学院 音视频高级教程 ubuntu16.04 ffmpeg开发环境搭建
    配置环境ubuntudesktop16.04+ffmpeg4.2.1建议在《编译与安装》一节,都使用源码的方式编译和安装,本编译安装方式最终生成的皆为静态库。部分命令说明:git-C[git-command]指定其它路径的仓库执行命令注意,-C要在命令之前创建目录在home目录下创建ffmpeg_sources:用于下载源文......
  • 肖sir__影音视频讲解___项目整理
    一、参考链接直播产品:参考连接:https://www.axureshop.com/a/1401607.html 电商直播后台 二、项目简历:项目名称:xx直播app项目背景:我们是一个基于后台管理的一套电商直播后台系统,让线下的实体户家电卖家通过网络的直播平台来开拓市场,使客户在了解产品各项性能的同时来购......