首页 > 其他分享 >FFmpeg基础

FFmpeg基础

时间:2024-07-20 18:28:18浏览次数:16  
标签:FFmpeg 音频 基础 编解码器 解码器 格式 avcodec

文章目录

播放器框架

tips:

  1. 音频和视频用的处理的是一套通用的框架
  2. AVFormatContext是解复用后音视频流的句柄(类似于文件描述符)

在这里插入图片描述

图片非原创,原图出处:FFmpeg 简单文档 - CSDN博客

常见音视频概念

tips:

  1. avc格式实际上就是h264格式

常用音视频术语:

  1. 容器/文件(Conainer/File): 即特定格式的多媒体文件,比如mp4、 flv、 mkv等。
  2. 媒体流(Stream): 表示时间轴上的一段连续数据,如一段声音数据、一段视频数据或一段字幕数据,可以是压缩的,也可以是非压缩的,压缩的数据需要关联特定的编解码器(有些码流音频可能是纯PCM)。
  3. 数据帧/数据包(Frame/Packet): 通常,一个媒体流是由大量的数据帧组成的,对于压缩数据,帧对应着编解码器的最小处理单元,分属于不同媒体流的数据帧交错存储于容器之中。
  4. 编解码器: 编解码器是以帧为单位实现压缩数据和原始数据之间的相互转换的。
  • 解复用器

参考下图

在这里插入图片描述

图片非原创,原图出处:FFmpeg 简单文档 - CSDN博客

编解码器

参考下图

在这里插入图片描述

图片非原创,原图出处:FFmpeg 简单文档 - CSDN博客

FFmpeg的整体结构

图片来自网络

FFMPEG有8个常用库:

  1. AVUtil:核心工具库,下面的许多其他模块都会依赖该库做一些基本的音视频处理操作。
  2. AVFormat:文件格式和协议库,该模块是最重要的模块之一,封装了Protocol层和Demuxer、 Muxer层,使得协议和格式对于开发者来说是透明的。
  3. AVCodec:编解码库,封装了Codec层,但是有一些Codec是具备自己的License的, FFmpeg是不会默认添加像libx264、 FDK-AAC等库的,但是FFmpeg就像一个平台一样,可以将其他的第三方的Codec以插件的方式添加进来,然后为开发者提供统一的接口。
  4. AVFilter:音视频滤镜库,该模块提供了包括音频特效和视频特效的处理,在使用FFmpeg的API进行编解码的过程中,直接使用该模块为音视频数据做特效处理是非常方便同时也非常高效的一种方式。
  5. AVDevice:输入输出设备库,比如,需要编译出播放声音或者视频的工具ffplay,就需要确保该模块是打开的,同时也需要SDL的预先编译,因为该设备模块播放声音与播放视频使用的都是SDL库。
  6. SwrRessample:该模块可用于音频重采样,可以对数字音频进行声道数、数据格式、采样率等多种基本信息的转换。
  7. SWScale:该模块是将图像进行格式转换的模块,比如,可以将YUV的数据转换为RGB的数据,缩放尺寸由1280720变为800480。
  8. PostProc:该模块可用于进行后期处理,当我们使用AVFilter的时候需要打开该模块的开关,因为Filter中会使用到该模块的一些基础函数

FFmpeg常用函数简介

注册相关

  1. av_register_all()注册所有组件,4.0已经弃用
  2. avdevice_register_all(),对设备进行注册,比如V4L2等。
  3. avformat_network_init(),初始化网络库以及网络加密协议相关的库(比如openssl)

封装格式相关

Alt

  1. avformat_alloc_context();负责申请一个AVFormatContext结构的内存,并进行简单初始化
  2. avformat_free_context();释放该结构里的所有东西以及该结构本身
  3. avformat_close_input();关闭解复用器。关闭后就不再需要使用avformat_free_context 进行释放。
  4. avformat_open_input()打开输入视频文件
  5. avformat_find_stream_info()获取音视频文件信息
  6. av_read_frame()读取音视频包
  7. avformat_seek_file()定位文件
  8. av_seek_frame()定位文件

解码器相关

在这里插入图片描述

tips:

  • 编码器有不仅有ID,还有name,这两个之间是不冲突的,ID是用于标识编码器的格式,例如h264等等,而每一个编码器都有自己的名字。这样做的目的是因为,同一种格式的编码器不止有一个,不止一个厂家在做,例如h264就是一种技术标准,所以可以有很多编码器去实现他,所以一个编码器不仅有ID,还有他自己的name。
  • 解码器上下文中的数据并不是保存在解码器当中的,而是保存在解码器句柄(结构体)AVCodecContex中的,所以解码器是需要关联到AVCodecContex的。
  • avcodec_find_decoder,找到第一个对应ID的解码器就返回。avcodec_find_decoder_by_name,只会根据指定的名字查找。
  1. avcodec_alloc_context3(),分配解码器上下文
  2. avcodec_find_decoder(),根据ID查找解码器
  3. avcodec_find_decoder_by_name(),根据解码器名字查找解码器
  4. avcodec_open2(),打开编解码器
  5. avcodec_decode_video2(),解码一帧视频数据
  6. avcodec_decode_audio4(),解码一帧音频数据
  7. avcodec_send_packet(),发送编码数据包
  8. avcodec_receive_frame(),接收解码后数据
  9. avcodec_free_context(),释放解码器上下文,包含了avcodec_close()
  10. avcodec_close(),关闭解码器
  • ffmpeg组件注册方式

对于 ffmpeg-3.x 的版本:我们使用ffmpeg,首先要执行av_register_all,把全局的解码器、编码器等结构体注册到各自全局的对象链表里,以便后面查找调用。

参考:


对于ffmpeg-4.0及以后的版本,组件注册就由FFmepg内部去做,不再需要用户调用API去注册了。 也就是说,现在的ffmpeg已经不需要我们再手动注册组件了,ffmpeg内部会自动注册。

FFmpeg常用结构体简介

AVFormatContext,封装格式上下文结构体,也是统领全局的结构体,保存了视频文件封装格式相关信息。
AVInputFormat demuxer + AVOutputFormat muxer,每种封装格式(例如FLV, MKV, MP4, AVI)对应一个该结构体对象。
AVStream视频文件中每个视频(音频)流对应一个该结构体。
AVCodecContext编解码器上下文结构体,保存了视频(音频)编解码相关信息。
AVCodec每种视频(音频)编解码器(例如H.264解码器)对应一个该结构体。
AVPacket存储一帧压缩编码数据。
AVFrame存储一帧解码后像素(采样)数据。

  • 结构体字段分析(了解即可)

AVFormatContext

• iformat:输入媒体的AVInputFormat,比如指向AVInputFormat
ff_flv_demuxer
• nb_streams:输入媒体的AVStream 个数
• streams:输入媒体的AVStream []数组
• duration:输入媒体的时长(以微秒为单位),计算方式可以参
考av_dump_format()函数。
• bit_rate:输入媒体的码率

AVInputFormat

• name:封装格式名称
• extensions:封装格式的扩展名
• id:封装格式ID
• 一些封装格式处理的接口函数,比如read_packet()

AVStream

• index:标识该视频/音频流
• time_base:该流的时基, PTS*time_base=真正的时间(秒)
• avg_frame_rate: 该流的帧率
• duration:该视频/音频流长度
• codecpar:编解码器参数属性

AVCodecParameters

• codec_type:媒体类型,比如AVMEDIA_TYPE_VIDEO
AVMEDIA_TYPE_AUDIO等
• codec_id:编解码器类型, 比如AV_CODEC_ID_H264
AV_CODEC_ID_AAC等。

AVCodecContext

• codec:编解码器的AVCodec,比如指向AVCodec
ff_aac_latm_decoder
• width, height:图像的宽高(只针对视频)
• pix_fmt:像素格式(只针对视频)
• sample_rate:采样率(只针对音频)
• channels:声道数(只针对音频)
• sample_fmt:采样格式(只针对音频)

AVCodec

• name:编解码器名称
• type:编解码器类型
• id:编解码器ID
• 一些编解码的接口函数,比如int (*decode)()

AVPacket

• pts:显示时间戳
• dts:解码时间戳
• data:压缩编码数据
• size:压缩编码数据大小
• pos:数据的偏移地址
• stream_index:所属的AVStream

AVFrame

• data:解码后的图像像素数据(音频采样数据)
• linesize:对视频来说是图像中一行像素的大小;对音频来说是整个音频帧的大小
• width, height:图像的宽高(只针对视频)
• key_frame:是否为关键帧(只针对视频) 。
• pict_type:帧类型(只针对视频) 。例如I, P, B
• sample_rate:音频采样率(只针对音频)
• nb_samples:音频每通道采样数(只针对音频)
• pts:显示时间戳

ffmpeg内存模型

参考:FFmpeg内存模型与API介绍【转载】
其主要内容为AVPacket和AVFrame关于指向同一块内存的引用计数问题。

标签:FFmpeg,音频,基础,编解码器,解码器,格式,avcodec
From: https://blog.csdn.net/m0_73759312/article/details/140574512

相关文章

  • Linux基础--Shell命令解释器
    Linux提供的Shell解析器bash和sh的关系sh是bash的一个软链接注意:Centos默认的Shell解析器是bash定义bash变量环境变量名建议大写等号两侧不能有空格,如果有空格,则需要使用双引号或单引号括起来定义时不用加$符号,使用时需要加$符号1是查看现在username,2是删除......
  • Java基础语法01-运算符&流程控制语句If
    Java基础语法1.运算符1.1算术运算符(理解)1.1.1运算符和表达式运算符:对常量或者变量进行操作的符号表达式:用运算符把常量或者变量连接起来符合java语法的式子就可以称为表达式。​不同运算符连接的表达式体现的是不同类型的表达式。举例说明:inta=10;intb=2......
  • Java基础语法02——While循环和Switch
    4.switch语句4.1switch语句结构(掌握)格式switch(表达式){ case1: 语句体1; break; case2: 语句体2; break; ... default: 语句体n+1; break;}执行流程:首先计算出表达式的值其次,和case依次比较,一旦有对应的值,就会执行相应的语句,在执行的过程中......
  • JAVA 基础数据类型
    一、数据类型Java语言是一个面向对象的语言,但是Java中的基本数据类型却是不面向对象的,这在实际使用时存在很多的不便,为了解决这个不足,在设计类时为每个基本数据类型设计了一个对应的类进行代表,这样八个和基本数据类型对应的类统称为包装类(WrapperClass),有些地方也翻译为外......
  • 信息系统基础知识
    信息系统概述信息系统是由计算机硬件、网络和通信设备、计算机软件、信息资源、信息用户和规章制度组成的以处理信息流为目的的人机一体化系统。信息系统的5个基本功能输入存储处理输出控制信息系统的性质影响着系统开发者和系统用户的知识需求。以计算机为基础:要求......
  • java的一些基础知识
    文章目录JDK、JRE、JVM变量关键字标识符规则数据类型基本数据类型(简单数据类型)引用数据类型(除基本数据类型以外的数据类型)运算符Java流程控制语句分支语句循环语句特殊的流程控制语句方法形参实参数组数组动态初始化和静态初始化数组的复制数组的扩容数组的删除二维......
  • 嵌入式学习记录——C基础(数组与排序)
    数组与排序数组一维数组二维数组排序冒泡排序选择排序数组数组是由一个或者多个相同数据类型的数据组成的一个集合一维数组如果将数组看做一个坐标轴,一维数组则如同只有X坐标,每个数组中的元素内存地址都是连续的,当数据类型和首个元素a[0]确定时,后续a[i]依次递增......
  • python函数基础
    1.函数目的函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段。函数能提高应用的模块性,和代码的重复利用率。函数可以封装一定的功能2.函数的定义函数代码块以 def 关键词开头,后接函数标识符名称和圆括号 ()。任何传入参数和自变量必须放在圆括号中间,圆括......
  • 算法基础课第一章(中)高精度+前缀和+差分
    一、高精度(一)使用高精度的原因在计算机中处理非常大或非常小的数值时,确保计算结果的精确性和准确性。在特定情况下,可以自己实现高精度计算的数据结构和算法,例如使用字符串或数组来表示大数,并实现基本的加、减、乘、除操作。(二)高精度加法1、方法(1)描述:从最低位开始加法计算......
  • 一周学完Java基础,第六天,常见容器
    (1)列表List         接口:    java.util.List<>    实现方式:    java.util.ArrayList<>:变长数组    java.util.LinkedList<>:双链表    函数:    add():在末尾添加一个元素    clear():......