Python爬取豆瓣音乐top250

时间：2024-11-01 14:18:26浏览次数：6

标签：__ Python find 爬取 item music top250 class

import requests
from bs4 import BeautifulSoup
import pandas as pd
import time
def crawl_douban_music_top250():
    data = []
    base_url = "https://music.douban.com/top250"
    for i in range(0, 250, 25):
        url = f"{base_url}?start={i}"
        headers = {
            "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36"
        }
        response = requests.get(url, headers=headers)
        soup = BeautifulSoup(response.text, 'html.parser')
        music_items = soup.find_all('tr', class_='item')
        for item in music_items:
            name = item.find('div', class_='pl2').a.text.strip()
            link = item.find('div', class_='pl2').a['href']
            score = item.find('span', class_='rating_nums').text
            score_people = item.find('span', class_='pl').text.strip().replace('人评价', '')
            data.append({
                "名称": name,
                "链接": link,
                "评分": score,
                "评分人数": score_people
            })
        time.sleep(1)
    df = pd.DataFrame(data)
    df.to_csv('豆瓣音乐top250.csv', index=False, encoding='utf-8')
if __name__ == "__main__":
    crawl_douban_music_top250()

标签：__,Python,find,爬取,item,music,top250,class
From： https://blog.csdn.net/qq_68809241/article/details/143423354

Python制作视频解析全平台免费追剧神器
importtkinter.messageboxasmsgboximporttkinterastkimportwebbrowserimportreimporturllib.parseclassAPP:def__init__(self,width=500,height=300):self.width=widthself.height=heightself.title='视频解析器&#......
使用python爬虫爬取热门文章分析最新技术趋势
本文借助爬虫来分析哪些技术正在快速发展，哪些问题在开发者中引起广泛讨论，从而为学习和研究提供重要参考。使用python爬虫分析最新技术趋势一、爬取目标二、代码环境2.1编程语言2.2三方库2.3环境配置三、代码实战3.1接口分析3.2接口参数分析接口地址请求方法描述......
在 Python 中将列表转换为字符串需要哪些技术
在Python中，列表转换为字符串的技术主要包括使用join方法、使用for循环拼接、以及通过map函数结合join方法等手段。在详述中，我们会重点讲解join方法，这是将列表转换为字符串的最简便及最常用的技术。它通过连接序列中的元素，来生成一个新的字符串。一、使用JOIN方法join方法是将......
Python内存模型
Python深浅拷贝一.变量的内存模型x=1print(id(x))#94454455464992print(id(1))#94454455464992print(id(5))#94454455465120x=5print(id(x))#94454455465120print(id(1))#94454455464992print(id(5))#94454455465120"""Python更改变量值，发生变化......
Python格式化字符串
1.%格式化最早用%进行格式化字符串#%d%s%f格式化字符串name="Max"num=1print("Hello%s,yournumis%d"%(name,num))#HelloMax,yournumis1#也支持字典形式格式化print("Hello[%(name)s],yournumis%(num)d"%{"num":1,"name&q......
Python的数值与bytes类型
Python中数值的表示进制表示n=97#十进制表示97n=0b01100001#二进制表示97n=0x61#十六进制表示97n=0o141#八进制表示97上面四种方式定义的值是等价的，均为十进制的97ASCII编码表示n="a"n="\b01100001"n="\x61"n="\o141"上面四种方式定义的值也是等价......
https脚本python和bash版本
以下是一个使用 `curl` 的 Bash 脚本，可以发送 HTTPS 的 GET 和 POST 请求，同时支持 cookies 和gzip 压缩： ```bash#!/bin/bash # 默认配置COOKIE_FILE="cookies.txt" # 存储cookies的文件USER_AGENT="Mozilla/5.0(X11;Ubuntu;Linuxx86_64)AppleWe......
【Python】网络请求与数据获取：Requests库的使用与技巧
网络请求与数据获取：Requests库的使用与技巧在现代Web开发与数据科学工作中，从API、网页或服务端获取数据是非常常见的任务，而Python的Requests库为此提供了便捷且功能强大的工具。本文将从基本的HTTP请求操作出发，结合常见的数据获取需求，深入讲解Requests的使用......
python 计算 sin 值
概述当角（弧度描述）x足够小时，sin(x)约等于x，而已知三角等式sin(x)=3sin(x/3)-4sin^3(x/3)，用python语言计算任意大的弧度角的sin值实现可以利用给定的三角恒等式[\sin(x)=3\sin\left(\frac{x}{3}\right)-4\sin^3\left(\frac{x}{3}\right)]来递归地计算任意弧度......
使用wxpython开发跨平台桌面应用，对wxpython控件实现类似C#扩展函数处理的探究
本人之前对C#开发非常喜欢，也从事开发C#开发桌面开发、Web后端、Vue前端应用开发多年，最近一直在研究使用Python，希望能够把C#的一些好的设计模式、开发便利经验引入到Python开发中，很多时候类似的开发方式，可以极大提高我们开发的效率，本篇随笔对wxpython控件实现类似C#扩展函数处理的......

Python爬取豆瓣音乐top250

相关文章

赞助商

阅读排行