一、概述
在本地进行音视频处理时,首先要从视频文件进行音视频加载,最后要将处理结果输出到文件。本节介绍moviepy的音视频的加载和输出方法。
二、视频加载
2.1、视频加载方法
要从视频文件中加载视频非常简单,使用VideoFileClip类的构造方法即可完成加载。其构造方法语法如下:
__init__(self, filename, has_mask=False,
audio=True, audio_buffersize=200000,
target_resolution=None, resize_algorithm='bicubic',
audio_fps=44100, audio_nbytes=2, verbose=False,
fps_source='tbr')
2.1.1、参数释义
filename:视频文件名,只要是ffmpeg支持的视频文件如 .ogv, .mp4, .mpeg, .avi, .mov等都可以
has_mask:如果视频文件中包含遮罩该参数设置为“True”
audio:如果视频没有声音或者希望加载时不读取音频,则应该将audio设置为False
audio_buffersize:音频缓冲区大小,一般使用缺省值即可
target_resolution:设置为加载后需要变换到的分辨率,类型为列表或元组,第一个元素为分辨率的高,第二个为宽,如果高或宽有一个为None,则保持现有纵横比调整帧的大小。如果保持原分辨率不变,则不需要设置本参数或设置为None。如果设置了新的分辨率,则在调用ffmpeg 返回视频剪辑的帧之前会按新的分辨率调整帧的大小。这比使用转换为高分辨率流然后再调整分辨率会快很多
resize_algorithm:要改变加载后的视频分辨率,可以通过resize_algorithm指定调整分辨率的算法,缺省值为 “bicubic”,还可以是 “bilinear” 、"fast_bilinear"等。关于算法的更多信息请参考:https://ffmpeg.org/ffmpeg-scaler.html
audio_fps:声音的采样频率
audio_nbytes:采样的位数
verbose:是否在标准输出设备上显示处理信息
fps_source:从视频的元数据metadata哪个数据中获取fps值,默认设置为’tbr’,但可以设置为’fps’,这可能有助于导入慢动作视频,否则会弄糟。
2.1.2、返回值
返回值为VideoFileClip实例对象。
2.2、代码样例
下面这段代码取1.mp4的分辨率作为2.mp4加载时的分辨率
import moviepy.editor as mpe
clip1 = mpe.VideoFileClip("1.mp4")
clipSize = clip1.size
clip2 = mpe.VideoFileClip("2.mp4",verbose=True,target_resolution=[clipSize[1],clipSize[0])
三、音频的加载
要从音频文件中加载音 频非常简单,使用AudioFileClip类的构造方法即可完成加载。其构造方法语法如下:__init__(self, filename, buffersize=200000, nbytes=2, fps=44100):
相关参数的含义除了filename指向音频文件外,其他与VideoFileClip对应参数含义一致,nbytes对应VideoFileClip的audio_nbytes。
返回值为一个AudioFileClip对象。
四、音视频的输出
4.1、视频的输出方法
视频输出的方法为VideoFileClip的write_videofile方法,语法如下:
def write_videofile(self, filename, fps=None, codec=None,
bitrate=None, audio=True, audio_fps=44100,
preset="medium",
audio_nbytes=4, audio_codec=None,
audio_bitrate=None, audio_bufsize=2000,
temp_audiofile=None,
rewrite_audio=True, remove_temp=True,
write_logfile=False, verbose=True,
threads=None, ffmpeg_params=None,
logger='bar')
部分前面没有出现的参数说明如下:
codec:用于图像编码的编解码器,可以是ffmpeg支持的任何编解码器。如果文件名的扩展名为“.mp4”、“.ogv”、“.webm”,则会相应地设置编解码器,但如果不喜欢默认值,则仍可以进行设置。对于其他扩展名,必须相应地设置输出文件名。一些常用的编解码器如下:
‘libx264’:视频压缩效果好的一款编解码器,MP4的缺省编解码器,视频质量通过bitrate参数调节
‘mpeg4’:一种可选的MP4编解码器,可以替代’libx264’,可以获得更好的视频质量
‘rawvideo’:完美的视频质量,但文件会巨大,对应视频文件为’.avi’
‘png’:完美的视频质量,对应视频文件为’.avi’,但文件大小比’rawvideo’小
‘libvorbis’:是一种完全开放、免费的编解码器,有不错的视频格式,但是要不广,对应视频文件为’.ogv’
‘libvpx’:一种很适合在HTML5中使用的网络视频轻量级编开源解码器,对应视频文件为’.webm’
audio:可以为True、False或文件名,如果True且剪辑附加了音频,则音频将作为视频的音频保存,如果为False则不保存音频,如果为音频文件名则将此音频文件将作为视频的音频
temp_audiofile:如果输出由音频,则该参数用于指定要生成并合并到电影中的临时音频文件的名称,如果没有指定则用缺省模式的临时文件名
audio_codec:音频解码器,例如’.mp3’的’libmp3lame’、‘ogg’的’libvorbis’、 ‘m4a’的’libfdk_aac’、 ‘pcm_s16le’ 16位声音和’pcm_s32le’的32位声音。默认值为“libmp3lame”,除非视频扩展名为“ogv”或“webm”,在这2种情况下,默认值为“libvorbis”。
audio_bitrate:音频比特率,字符串形式,如“50k”、“500k”、“3000k”,用于将确定输出文件中音频的大小/质量。请注意,这主要是一个指示性目标,输出文件的比特率不一定会按此设置。
preset:设置FFMPEG用于优化压缩的时间。字符串类型,可选值有:ultrafast、superfast、veryfast、faster、fast、medium、slow、slower、veryslow、 placebo。请注意,这不会影响视频的质量,只影响视频文件的大小。所以如果赶时间而文件大小不是很重要可以设置为ultrafast
threads:用于ffmpeg的线程数,可以加快多核计算机上视频输出的速度
ffmpeg_params:需要额外传递的任何其他ffmpeg参数,使用列表传递,形如:[’-option1’,‘value1’,’-option2’,‘value2’]
write_logfile:如果为True,将为音频和视频输出记录日志文件。日志文件将以“.log”结尾,包含输出文件的名称
logger:字符串类型,"bar"表示进度条、None 表示不设置、或任何程序日志记录器的名字
verbose:已经废弃使用,留下来是为了兼容性,以前用于打开/关闭消息。现在使用logger=None。
五、音频的输出
音频的输出调用AudioFileClip的write_audiofile方法,具体语法如下:
write_audiofile(self, filename, fps=None, nbytes=2, buffersize=2000,
codec=None, bitrate=None, ffmpeg_params=None,
write_logfile=False, verbose=True, logger='bar')