首页 > 编程语言 >Python爬虫:爬取B站视频(详细讲解)

Python爬虫:爬取B站视频(详细讲解)

时间:2024-10-24 13:16:15浏览次数:8  
标签:视频 文件 Python 音频 爬虫 爬取 视频文件 我们

Hello,大家好,我是南枫,今天带来什么项目呢?就是——爬B站视频

刷过B站的都知道,B站并没有下载功能,连官网都没有下载功能的话,那我们还能正常爬取吗?当然~

首先我们要知道B站视频是分为视频和音频两部分,所以我们抓下来还不行,还需要把视频和音频给拼接起来。

工作量乍一看感觉很大,其实很简单,那么现在,跟着我的步伐一起来瞅瞅吧!

进行抓取之前,想问大家一个问题,请看图:

图片

大家觉得整个页面,这两个部分谁占用的内存最大?最多

毋庸置疑的就是第一个部分(视频),请大家记住这一点,接下来,我们一起打开检查来进行常规操作。

图片

总共有429个请求,并且还在不断增加,那我们如何从这么多文件里找到视频的文件呢?

我们上面说了,整个页面哪个部分占的内容最多?那就是视频!

那我们直接来进行排序,把所有文件按照从大到小进行排序(你想从小到大也没人拦你),怎么排序呢?如图:

图片

点大小就行,so ez。那第一个就是视频文件吗?其实并不是,而是这三个文件:

图片

这三个文件都是视频文件,不相信我的你接着看好了~,开始写代码:

图片

成功爬取下来,接下来看看能不能进行播放:

图片

播放正常,但,有个问题,只有视频,并没有声音,那我们是不是还得抓音频呢?对的没错,那么音频在哪呢?回到网站,往下滑:

图片

可以看到,这里又有三个文件,他们仨和视频文件不一样,不一样的点在哪?

这是视频的文件,数字是:30064

图片

我们看音频的文件,数字是:30232

图片

所以视频文件和音频文件的区别,肉眼可见的就是数字而已哈哈哈哈哈,直接上代码:

图片

那么这里要注意一点,视频文件的格式是 .mp4;音频文件的格式是 .mp3,大家注意不要搞混咯。

图片

图片

播放音频看有没有问题:

图片

没有问题,那么我们B站的视频和音频就爬取下来了~非常的ez是吧,但有个问题,既然视频和音频都爬下来了,但我们又该怎么把他们俩合并在一起形成正常的视频呢?

带着这个疑问,请看下一篇文章~

标签:视频,文件,Python,音频,爬虫,爬取,视频文件,我们
From: https://blog.csdn.net/weixin_53707653/article/details/143154408

相关文章

  • python_matlab图像去雾_去雨综述
    图像去雾和去雨是计算机视觉领域的两个重要任务,旨在提高图像质量和可视化效果。本文将综述图像去雾和去雨的算法、理论以及相关项目代码示例。一、图像去雾算法基于暗通道先验的方法:这是广泛应用于图像去雾的经典算法之一。该方法基于一个观察:自然场景中的大多数像素在......
  • 2024年韩顺平老师Python教程保姆级笔记
    代码获取:https://github.com/qingxuly/hsp_python_coursePython语言描述Python转义字符Python常用的转义字符转义字符说明\t制表符,实现对齐的功能\n换行符,\\一个\\"一个"\'一个'\r一个回车代码演示#\t制表符print("jack\t20")​#\n换行print("Hello,jack......
  • wrf-python安装教程
    记录一下wrf-python安装过程安装过程中出现了许多报错,这里记录了成功安装的完整流程。1.创建新环境#创建一个新环境推荐使用3.11版本condacreate-nWRFpython=3.11condaactivateWRF2.搭建Fortran环境1.安装visualstudio(自行前往官网下载)2.安装OneAPI(Base......
  • Python数据分析结合OpenAI:智能数据摘要和洞察
    Python数据分析结合OpenAI:智能数据摘要和洞察Python数据分析结合OpenAI:智能数据摘要和洞察在数据分析领域,随着数据集规模的日益庞大,如何从复杂的数据集中提取有价值的信息成为关键挑战。借助OpenAI的自然语言处理(NLP)能力,分析师可以自动生成摘要、报告,并获得有洞察力的结论......
  • 第10章-Python正则表达式
    在日常生活中,经常会遇到访问一个新的网站时,只有注册成网站用户才能够登录使用。一个用户在填写注册信息时,通常会要求填写手机号、邮箱等信息,在填写信息的过程中网站会对填写的手机号、邮箱进行验证。那么这个验证的过程是如何实现的呢?其实原理很简单,就是使用正则表达式进行......
  • 第11章-Python网络编程
    网络编程是Python比较擅长的领域,Python不但内置了网络编程相关的库,而且与网络编程相关的第三方库也非常丰富,所以使用Python进行网络编程非常方便,Web应用程序、网络爬虫、网络游戏等常见的网络应用都可以使用Python进行开发。本章将介绍Python网络编程基础、内置的urllib库和......
  • Windows、macOS和Linux系统安装Python的指南
    在不同的操作系统上安装Python通常涉及几个简单的步骤。以下是在Windows、macOS和Linux系统上安装Python的指南:Windows系统安装Python:下载Python安装程序:访问Python官方网站 python.org。选择适合Windows的Python版本(确保下载最新稳定版)。运行安装程序:双击下载的.exe文......
  • 【磐维数据库】通过python访问磐维数据库
    安装psycopg21、下载并解压包下载网址https://opengauss.org/zh/download/解压包#tar-zxvfopenGauss-5.0.2-CentOS-x86_64-Python.tar.gz解压安装包后,会得到两个目录lib和psycopg2。lib是psycopg2依赖的libpq等C动态库文件。2、将解压后的lib和psycopg2目录拷贝到......
  • 计算机毕业设计Spark+大模型某音视频情感分析 某音可视化 某音舆情监测 预测算法 某音
    《Spark+大模型抖音视频情感分析》开题报告一、研究背景与意义随着移动互联网和社交媒体的快速发展,短视频平台如抖音(TikTok)已成为全球范围内广受欢迎的娱乐和信息获取渠道。用户在这些平台上发布的视频内容涵盖了娱乐、教育、新闻等各个领域,形成了海量的用户行为数据和视频内......
  • 计算机毕业设计hadoop+spark知网文献论文推荐系统 知识图谱 知网爬虫 知网数据分析 知
    下面是一个简单的文献推荐系统算法示例,使用Python和scikit-learn库。这个示例基于协同过滤算法,该算法通过分析用户对文献的评分来推荐新的文献。为了简单起见,这里使用了一个小的数据集,并假设数据已经预处理过(例如,用户-文献评分矩阵)。首先,确保你已经安装了scikit-learn库:pip......