Python爬虫：爬取B站视频（详细讲解）

时间：2024-10-24 13:16:15浏览次数：8

标签：视频文件 Python 音频爬虫爬取视频文件我们

Hello，大家好，我是南枫，今天带来什么项目呢？就是——爬B站视频。

刷过B站的都知道，B站并没有下载功能，连官网都没有下载功能的话，那我们还能正常爬取吗？当然~

首先我们要知道B站视频是分为视频和音频两部分，所以我们抓下来还不行，还需要把视频和音频给拼接起来。

工作量乍一看感觉很大，其实很简单，那么现在，跟着我的步伐一起来瞅瞅吧！

进行抓取之前，想问大家一个问题，请看图：

大家觉得整个页面，这两个部分谁占用的内存最大？最多？

毋庸置疑的就是第一个部分（视频），请大家记住这一点，接下来，我们一起打开检查来进行常规操作。

总共有429个请求，并且还在不断增加，那我们如何从这么多文件里找到视频的文件呢？

我们上面说了，整个页面哪个部分占的内容最多？那就是视频！

那我们直接来进行排序，把所有文件按照从大到小进行排序（你想从小到大也没人拦你），怎么排序呢？如图：

点大小就行，so ez。那第一个就是视频文件吗？其实并不是，而是这三个文件：

这三个文件都是视频文件，不相信我的你接着看好了~，开始写代码：

成功爬取下来，接下来看看能不能进行播放：

播放正常，但，有个问题，只有视频，并没有声音，那我们是不是还得抓音频呢？对的没错，那么音频在哪呢？回到网站，往下滑：

可以看到，这里又有三个文件，他们仨和视频文件不一样，不一样的点在哪？

这是视频的文件，数字是：30064

我们看音频的文件，数字是：30232

所以视频文件和音频文件的区别，肉眼可见的就是数字而已哈哈哈哈哈，直接上代码：

那么这里要注意一点，视频文件的格式是 .mp4；音频文件的格式是 .mp3，大家注意不要搞混咯。

播放音频看有没有问题：

没有问题，那么我们B站的视频和音频就爬取下来了~非常的ez是吧，但有个问题，既然视频和音频都爬下来了，但我们又该怎么把他们俩合并在一起形成正常的视频呢？

带着这个疑问，请看下一篇文章~

标签：视频,文件,Python,音频,爬虫,爬取,视频文件,我们
From： https://blog.csdn.net/weixin_53707653/article/details/143154408

python_matlab图像去雾_去雨综述
图像去雾和去雨是计算机视觉领域的两个重要任务，旨在提高图像质量和可视化效果。本文将综述图像去雾和去雨的算法、理论以及相关项目代码示例。一、图像去雾算法基于暗通道先验的方法：这是广泛应用于图像去雾的经典算法之一。该方法基于一个观察：自然场景中的大多数像素在......
2024年韩顺平老师Python教程保姆级笔记
代码获取：https://github.com/qingxuly/hsp_python_coursePython语言描述Python转义字符Python常用的转义字符转义字符说明\t制表符，实现对齐的功能\n换行符，\\一个\\"一个"\'一个'\r一个回车代码演示#\t制表符print("jack\t20")#\n换行print("Hello,jack......
wrf-python安装教程
记录一下wrf-python安装过程安装过程中出现了许多报错，这里记录了成功安装的完整流程。1.创建新环境#创建一个新环境推荐使用3.11版本condacreate-nWRFpython=3.11condaactivateWRF2.搭建Fortran环境1.安装visualstudio(自行前往官网下载)2.安装OneAPI(Base......
Python数据分析结合OpenAI：智能数据摘要和洞察
Python数据分析结合OpenAI：智能数据摘要和洞察Python数据分析结合OpenAI：智能数据摘要和洞察在数据分析领域，随着数据集规模的日益庞大，如何从复杂的数据集中提取有价值的信息成为关键挑战。借助OpenAI的自然语言处理（NLP）能力，分析师可以自动生成摘要、报告，并获得有洞察力的结论......
第10章-Python正则表达式
在日常生活中，经常会遇到访问一个新的网站时，只有注册成网站用户才能够登录使用。一个用户在填写注册信息时，通常会要求填写手机号、邮箱等信息，在填写信息的过程中网站会对填写的手机号、邮箱进行验证。那么这个验证的过程是如何实现的呢？其实原理很简单，就是使用正则表达式进行......
第11章-Python网络编程
网络编程是Python比较擅长的领域，Python不但内置了网络编程相关的库，而且与网络编程相关的第三方库也非常丰富，所以使用Python进行网络编程非常方便，Web应用程序、网络爬虫、网络游戏等常见的网络应用都可以使用Python进行开发。本章将介绍Python网络编程基础、内置的urllib库和......
Windows、macOS和Linux系统安装Python的指南
在不同的操作系统上安装Python通常涉及几个简单的步骤。以下是在Windows、macOS和Linux系统上安装Python的指南：Windows系统安装Python：下载Python安装程序：访问Python官方网站 python.org。选择适合Windows的Python版本（确保下载最新稳定版）。运行安装程序：双击下载的.exe文......
【磐维数据库】通过python访问磐维数据库
安装psycopg21、下载并解压包下载网址https://opengauss.org/zh/download/解压包#tar-zxvfopenGauss-5.0.2-CentOS-x86_64-Python.tar.gz解压安装包后，会得到两个目录lib和psycopg2。lib是psycopg2依赖的libpq等C动态库文件。2、将解压后的lib和psycopg2目录拷贝到......
计算机毕业设计Spark+大模型某音视频情感分析某音可视化某音舆情监测预测算法某音
《Spark+大模型抖音视频情感分析》开题报告一、研究背景与意义随着移动互联网和社交媒体的快速发展，短视频平台如抖音（TikTok）已成为全球范围内广受欢迎的娱乐和信息获取渠道。用户在这些平台上发布的视频内容涵盖了娱乐、教育、新闻等各个领域，形成了海量的用户行为数据和视频内......
计算机毕业设计hadoop+spark知网文献论文推荐系统知识图谱知网爬虫知网数据分析知
下面是一个简单的文献推荐系统算法示例，使用Python和scikit-learn库。这个示例基于协同过滤算法，该算法通过分析用户对文献的评分来推荐新的文献。为了简单起见，这里使用了一个小的数据集，并假设数据已经预处理过（例如，用户-文献评分矩阵）。首先，确保你已经安装了scikit-learn库：pip......

Python爬虫：爬取B站视频（详细讲解）

相关文章

赞助商

阅读排行