首页 > 编程语言 >Python爬虫实战,requests模块,Python爬取网易云歌曲并保存本地

Python爬虫实战,requests模块,Python爬取网易云歌曲并保存本地

时间:2022-12-07 13:00:09浏览次数:46  
标签:headers Python 爬取 url music 模块 requests

前言

今天给大家简单演示的爬取了一下某易云歌曲的排行榜信息,最后将音乐保存到本地

排行榜信息

开发工具

Python版本: 3.6.4

相关模块:

requests模块

re模块

os模块

环境搭建

安装Python并添加到环境变量,pip安装需要的相关模块即可。

思路分析

本文以爬虫某易云音乐,讲解如何采集某易云音乐抓取歌曲

要爬取的部分歌曲如下图所示:

部分歌曲

提取我们歌曲页面数据

浏览器中打开我们要爬取的页面
按F12进入开发者工具,查看我们想要的数据在哪里
这里我们需要歌曲页面数据就可以了

页面数据

代码实现:爬虫蕞基本流程

1.发送请求
2.获取数据
3.解析数据
4.保存数据

伪装

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
url = 'https://music.163.com/discover/toplist?id=3778678'

1.发送请求

response = requests.get(url=url, headers=headers)

2.获取数据

print(response.text)

3.解析数据

info_list = re.findall( 'lio<a href="/song \?id=(.*?)"">(.*?)</a></li>',html_data)
for music, title in result:
    music_url = f'http://music.163.com/song/media/outer/url?id={music}.mp3'
    music_content = requests.get(url=music_url, headers=headers).content

4.保存数据

    with open(filename + title + '.mp3', mode='wb') as f:
        f.write(music_content)
        print(title)

结果展示

image.png

最后

今天的分享到这里就结束了 ,感兴趣的朋友也可以去试试哈

对文章有问题的,或者有其他关于python的问题,可以在评论区留言或者私信我哦

觉得我分享的文章不错的话,可以关注一下我,或者给文章点赞(/≧▽≦)/

标签:headers,Python,爬取,url,music,模块,requests
From: https://www.cnblogs.com/guzichuan/p/16962778.html

相关文章

  • Opencv——python画点、画框
    画点:​​cv2.circle(img,center,radius,color[,thickness[,lineType[,shift]]])​​画框:​​cv2.rectangle(image,start_point,end_point,color,thickness)​​......
  • Python——实现网页模拟键盘输入和鼠标点击
    Python——实现网页模拟键盘输入和鼠标点击​​一.安装selenium库​​​​1.1win+R打开输入窗口​​​​1.2输入cmd,点击确定​​​​1.3输入代码:​​​​二.以谷歌浏览器......
  • python 读取excel 02
    读取文件夹内的所有表,输入想要查询的表名,列出对应表页签,查询对应内容并打印出来importxlrd print('输入‘x’返回上一步!!!') whileTrue:  print('\n输入想要查询的......
  • 我用iPad编了个Python贪吃蛇,附源码!
    贪吃蛇可以算是街机游戏中经典中的经典了,实际上即使是手敲代码也不会太难写。最近折腾了一番iPad上新上架的LightlyIDE,可以在iPad上编程开发,也支持GUI可视化界面,遂尝试使用......
  • Python——问题解决:matplotlib.pyplot绘制函数中文乱码
    代码frompylabimportmpl#中文库mpl.rcParams['font.sans-serif']=['SimHei']mpl.rcParams['axes.unicode_minus']=False例子plt.title("三次样条插值11点")plt.pl......
  • python 读取excel
    #!/usr/bin/pythonimportxlrd#打开excel表格data_excel=xlrd.open_workbook('macHex-MMQ873-PCL.xls')#获取所有sheet名称names=data_excel.sheet_names()......
  • Windows使用bat运行python并最小化
    Windows使用bat运行脚本新建一个runCMD.bat的文件,内容为以下示例rem最小化窗口@echooff%1(start/mincmd.exe/c%0:&exit)rem运行主程序@python"C:\WK-zc......
  • Python基础之学员管理系统
    一、学员管理系统1、系统简介需求:进⼊系统显示系统功能界⾯,功能如下:添加学员删除学员修改学员信息查询学员信息显示所有学员信息退出系统系统共6个功能,⽤户根据⾃⼰需求选取......
  • python实操案例__03--python定向爬虫之淘宝商品比价
    写在前面,本教程仅为技术学习与交流使用,禁止恶意使用。1基本步骤1.1对淘宝网页进行提取模拟浏览器免登录进入defgetHTMLText(url):try:#由于淘宝的防爬虫,所以......
  • 爬取图片并合成
    爬取的网址:urlimportrequestsfromlxmlimportetreefromtimeimportsleep#爬取多页页的代码defpageTotall(num=None):foriinrange(num):#从0到68......