首页 > 其他分享 >爬取b站番剧数据

爬取b站番剧数据

时间:2024-11-12 10:47:46浏览次数:3  
标签:站番剧 url season order 爬取 item json 数据 page

这就是b站番剧页面,然后f12进入开发者模式找出url

再观察第二页的url和第一页有何区别,发现page=页数,可以通过这个实现翻页,有不懂的欢迎来问,一起交流,新人感谢支持,也欢迎给出优化方案

参考代码:
import requests
import json
import pymongo


mongo_conn = pymongo.MongoClient()
for page in range(1,193):
    headers={
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/130.0.0.0 Safari/537.36'
    }
    url = f'https://api.bilibili.com/pgc/season/index/result?st=1&order=3&season_version=-1&spoken_language_type=-1&area=-1&is_finish=-1&copyright=-1&season_status=-1&season_month=-1&year=-1&style_id=-1&sort=0&page={page}&season_type=1&pagesize=20&type=1'
    response = requests.get(url,headers=headers)
    # print(response.status_code)
    json_str = response.content.decode()
    #json反序列化
    data = json.loads(json_str)
    for item in data['data']['list']:
        print(page,item['title'],item['order'])
        #存入mongoDB
        mongo_conn.bilibili.season.insert_one({'page':page,'title':item['title'],'order':item['order']})

链接数据库之前不要忘了开启服务,然后数据展示如下:

后面还可以对数据进行分析与可视化

标签:站番剧,url,season,order,爬取,item,json,数据,page
From: https://blog.csdn.net/m0_65088713/article/details/143702626

相关文章

  • SpringBoot小区蔬菜直销系统12x8w 程序+源码+数据库+调试部署+开发环境
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表系统内容:用户,商品分类,商品信息开题报告内容一、研究背景随着居民生活水平的提高和健康意识的增强,小区居民对新鲜、安全、便捷的蔬菜需求日益增长。传统的蔬......
  • SpringBoot线上书城网站h5z49 程序+源码+数据库+调试部署+开发环境
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表系统内容:用户,图书类型,热卖图书开题报告内容一、课题背景与意义随着互联网技术的快速发展,电子商务已成为现代商业活动的重要组成部分。线上书城作为电子商务......
  • 基于HarmonyOS Next的医疗数据防泄漏与身份认证方案:Device Certificate Kit的深度应用
    本文旨在深入探讨华为鸿蒙HarmonyOSNext系统(截止目前API12)的技术细节,基于实际开发实践进行总结。主要作为技术分享与交流载体,难免错漏,欢迎各位同仁提出宝贵意见和问题,以便共同进步。本文为原创内容,任何形式的转载必须注明出处及原作者。在医疗信息化快速发展的今天,医疗......
  • HarmonyOS Next在智能家居领域的安全架构:设备身份认证与数据防泄漏方案
    本文旨在深入探讨华为鸿蒙HarmonyOSNext系统(截止目前API12)的技术细节,基于实际开发实践进行总结。主要作为技术分享与交流载体,难免错漏,欢迎各位同仁提出宝贵意见和问题,以便共同进步。本文为原创内容,任何形式的转载必须注明出处及原作者。在智能家居蓬勃发展的今天,各种智......
  • 大数据量导入去重的优化方法探讨
    文章目录大数据量导入去重的优化方法探讨使用临时表缓存导入数据使用SQL查询不重复数据将不重复数据插入原始表性能对比分析单表去重双表去重总结大数据量导入去重的优化方法探讨在处理大规模数据导入(如十万级别)时,难免会遇到数据重复的问题。特别是当导入的数据......
  • 【云原生系列】你的数据隐私可能正在丢失
    嗨,各位朋友们!今天我们来聊聊一个在云计算领域非常热门的话题——数据隐私。随着云计算技术的迅猛发展,越来越多的数据被存储和处理在云端,那么,云服务提供商是怎么确保这些数据安全,不被滥用的呢?我们慢慢来讲。01理解云中的数据隐私首先,我们得明白什么是数据隐私。在云计算......
  • 1.redis常见数据类型-列表List
     列表类型-list①.列表list是一个单键多值的Redis列表是简单的字符串列表,按照插入顺序排序。你可以添加一个元素到列表的头部(左边)或者尾部(右边)它的底层实际是个双向链表,对两端的操作性能很高,通过索引下标的操作中间的节点性能会较差②.常用命令插入、删除、获......
  • Python 进行数据挖掘的算法介绍
    1.决策树决策树是一种用于分类和回归任务的监督学习算法。它通过树状结构来表示决策过程,每个内部节点表示一个属性上的测试,每个分支代表一个测试结果,每个叶节点代表一种分类结果。示例代码:fromsklearn.datasetsimportload_irisfromsklearn.treeimportDecisionTreeCl......
  • 【初阶数据结构与算法】线性表之链表的分类以及双链表的定义与实现
    文章目录一、链表的分类二、双链表的实现1.双链表结构的定义2.双链表的初始化和销毁初始化函数1初始化函数2销毁函数3.双链表的打印以及节点的申请打印函数节点的申请4.双链表的头插和尾插头插函数尾插函数5.双链表的查找和判空查找函数判空函数6.双链表的头删和尾......
  • javaScript数据类型及相互转换
    2.2、JS数据类型2.2.1、数据类型2.2.1.1、为什么需要数据类型在计算机中,不同的数据所需占用的存储空间是不同的,为了便于把数据分成所需内存大小不同的数据,充分利用存储空间,于是定义了不同的数据类型。简单来说,数据类型就是数据的类别型号2.2.1.2、变量的数据类型JS是一种......