首页 > 编程语言 >Python爬取豆瓣音乐top250

Python爬取豆瓣音乐top250

时间:2024-11-01 14:18:26浏览次数:6  
标签:__ Python find 爬取 item music top250 class

import requests
from bs4 import BeautifulSoup
import pandas as pd
import time
def crawl_douban_music_top250():
    data = []
    base_url = "https://music.douban.com/top250"
    for i in range(0, 250, 25):
        url = f"{base_url}?start={i}"
        headers = {
            "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36"
        }
        response = requests.get(url, headers=headers)
        soup = BeautifulSoup(response.text, 'html.parser')
        music_items = soup.find_all('tr', class_='item')
        for item in music_items:
            name = item.find('div', class_='pl2').a.text.strip()
            link = item.find('div', class_='pl2').a['href']
            score = item.find('span', class_='rating_nums').text
            score_people = item.find('span', class_='pl').text.strip().replace('人评价', '')
            data.append({
                "名称": name,
                "链接": link,
                "评分": score,
                "评分人数": score_people
            })
        time.sleep(1)
    df = pd.DataFrame(data)
    df.to_csv('豆瓣音乐top250.csv', index=False, encoding='utf-8')
if __name__ == "__main__":
    crawl_douban_music_top250()

标签:__,Python,find,爬取,item,music,top250,class
From: https://blog.csdn.net/qq_68809241/article/details/143423354

相关文章

  • Python制作视频解析全平台免费追剧神器
    importtkinter.messageboxasmsgboximporttkinterastkimportwebbrowserimportreimporturllib.parseclassAPP:def__init__(self,width=500,height=300):self.width=widthself.height=heightself.title='视频解析器&#......
  • 使用python爬虫爬取热门文章分析最新技术趋势
    本文借助爬虫来分析哪些技术正在快速发展,哪些问题在开发者中引起广泛讨论,从而为学习和研究提供重要参考。使用python爬虫分析最新技术趋势一、爬取目标二、代码环境2.1编程语言2.2三方库2.3环境配置三、代码实战3.1接口分析3.2接口参数分析接口地址请求方法描述......
  • 在 Python 中将列表转换为字符串需要哪些技术
    在Python中,列表转换为字符串的技术主要包括使用join方法、使用for循环拼接、以及通过map函数结合join方法等手段。在详述中,我们会重点讲解join方法,这是将列表转换为字符串的最简便及最常用的技术。它通过连接序列中的元素,来生成一个新的字符串。一、使用JOIN方法join方法是将......
  • Python内存模型
    Python深浅拷贝一.变量的内存模型x=1print(id(x))#94454455464992print(id(1))#94454455464992print(id(5))#94454455465120x=5print(id(x))#94454455465120print(id(1))#94454455464992print(id(5))#94454455465120"""Python更改变量值,发生变化......
  • Python格式化字符串
    1.%格式化最早用%进行格式化字符串#%d%s%f格式化字符串name="Max"num=1print("Hello%s,yournumis%d"%(name,num))#HelloMax,yournumis1#也支持字典形式格式化print("Hello[%(name)s],yournumis%(num)d"%{"num":1,"name&q......
  • Python的数值与bytes类型
    Python中数值的表示进制表示n=97#十进制表示97n=0b01100001#二进制表示97n=0x61#十六进制表示97n=0o141#八进制表示97上面四种方式定义的值是等价的,均为十进制的97ASCII编码表示n="a"n="\b01100001"n="\x61"n="\o141"上面四种方式定义的值也是等价......
  • https脚本python和bash版本
    以下是一个使用 `curl` 的 Bash 脚本,可以发送 HTTPS 的 GET 和 POST 请求,同时支持 cookies 和gzip 压缩: ```bash#!/bin/bash # 默认配置COOKIE_FILE="cookies.txt" # 存储cookies的文件USER_AGENT="Mozilla/5.0(X11;Ubuntu;Linuxx86_64)AppleWe......
  • 【Python】网络请求与数据获取:Requests库的使用与技巧
    网络请求与数据获取:Requests库的使用与技巧在现代Web开发与数据科学工作中,从API、网页或服务端获取数据是非常常见的任务,而Python的Requests库为此提供了便捷且功能强大的工具。本文将从基本的HTTP请求操作出发,结合常见的数据获取需求,深入讲解Requests的使用......
  • python 计算 sin 值
    概述当角(弧度描述)x足够小时,sin(x)约等于x,而已知三角等式sin(x)=3sin(x/3)-4sin^3(x/3),用python语言计算任意大的弧度角的sin值实现可以利用给定的三角恒等式[\sin(x)=3\sin\left(\frac{x}{3}\right)-4\sin^3\left(\frac{x}{3}\right)]来递归地计算任意弧度......
  • 使用wxpython开发跨平台桌面应用,对wxpython控件实现类似C#扩展函数处理的探究
    本人之前对C#开发非常喜欢,也从事开发C#开发桌面开发、Web后端、Vue前端应用开发多年,最近一直在研究使用Python,希望能够把C#的一些好的设计模式、开发便利经验引入到Python开发中,很多时候类似的开发方式,可以极大提高我们开发的效率,本篇随笔对wxpython控件实现类似C#扩展函数处理的......