语音信号处理是以语音语言学和数字信号处理技术相结合的交叉学科,它和认知科学、心理学、语言学、计算机科学、信号与信息处理、声学、模式识别和人工智能等学科联系紧密。
KCP 是一个开源的快速可靠协议,KCP 能以比 TCP 浪费 10%-20% 带宽的代价,换取平均延迟降低 30%-40%,最大延迟降低 3 倍的传输速度。KCP 是一层纯算法实现,并不负责底层协议(如 UDP)的收发,需要使用者自己定义下层数据包的发送方式,并以 callback 的方式提供给 KCP。
研究者通过调研发现,现今观众经常会受到听不清音频中人物对话的困扰,为给观众提供个性化的声平衡方案,这篇文章主要提出了一种利用深度学习改善音频中人物对话和环境声相对水平的声平衡方案 Dialog+,并通过线上调研和实地广播测试验证了该方案的有效性。
基于块的 DCT 变换和量化在 JPEG 等众多图像编码标准中起着重要作用。本文提出了一种名为 'DSCT' 的图像编码框架,它采用数据驱动的机器学习方法,基于像素的统计特性进行色彩变换和空间变换。
ffmpeg 源码分析-命令行1
本文章以 FFMpeg 4.2.5版本的源码为准,一定要对着源码看本文章,很多地方采用 cmdutils.c:778行 之类的写法。本系列主要分析 ffmpeg_parse_options() 转码的内部逻辑。
ffmpeg 源码分析-命令行2
ffmpeg 源码分析系列以一条简单的命令开始,ffmpeg -i a.mp4 b.flv,分析其内部逻辑。本文主要分析 parse_optgroup() 的内部逻辑,函数调用用流程图如下。
随着技术的不断发展,如今AR已经成为人尽皆知的行业热点,受到国内外巨头竞相追捧。那么一路走来,AR都经历了哪些鲜为人知的重要事件呢?下面小编整理了一份AR发展简史,带大家了解一下AR从无到有的发展历程。
英特尔在AI领域推动芯片和软件技术的进步,降低了网络应用开发者进入AI新领域的技术门槛,从而释放了开发者在商业化产品中部署AI高级技术的创新力,充分实现网络应用创新。
没有一种仿真工具可以用于测试ADS自动驾驶系统软件的所有方面,这就是为什么制造商将利用各种仿真工具的属性来建立对整个系统安全性的信心。
电动化开启汽车革命上半场,而智能化将引领下半场,在此交替过程中:核心竞争力转移:性能指标转变:燃油车以内燃机马力为指标;电动车以动力电池续航为目标;智能汽车时代,算力成为影响汽车性能的核心要素。
标签:视频,AI,技术,音视频,人工智能,技术开发,源码,KCP,231 From: https://blog.51cto.com/u_13530535/6466228