爬取王者荣耀皮肤并保存图片

时间：2023-04-06 13:33:25浏览次数：48

标签：ename 王者 get resp 荣耀爬取 cname pf each

import requests
import time
import pathlib
from lxml import etree

headers = {"user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36"}
url = "https://pvp.qq.com/web201605/js/herolist.json"
resp = requests.get(url, headers=headers)
all_content = resp.json()
url1 = "https://game.gtimg.cn/images/yxzj/img201606/heroimg/"
url2 = "https://pvp.qq.com/web201605/herodetail/"
url3 = "https://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/"

for each in all_content:
	cname = each.get("cname")
	ename = str(each.get("ename"))
	pathlib.Path(f'/data/wzry/王者荣耀皮肤/{cname}').mkdir()

for each in all_content:
	cname = each.get("cname")
	ename = str(each.get("ename"))
	try:
		resp = requests.get(f"{url1}{ename}/{ename}.jpg", headers=headers)
	except:
		print("未知异常")
		continue
	with open(f"王者荣耀皮肤/{cname}/{cname}.jpg", "wb") as f:
		f.write(resp.content)
	print(f"正在保存{cname}")
	time.sleep(1)

for each in all_content:
	cname = each.get("cname")
	ename = str(each.get("ename"))
	try:
		resp = requests.get(f"{url2}{ename}.shtml")
	except:
		print("未知异常")
		continue
	resp.encoding = "gbk"
	e = etree.HTML(resp.text)
	pf = e.xpath('//ul[@class="pic-pf-list pic-pf-list3"]/@data-imgname')
	pf = pf[0].split("|")
	time.sleep(1)

	for i,each in enumerate(pf):
		if "&" in each:
			t = each.index("&")
			pf_name = each[0:t]
		else:
			pf_name = each
		resp = requests.get(f"{url3}{ename}/{ename}-bigskin-{i+1}.jpg", headers=headers)
		with open(f"王者荣耀皮肤/{cname}/{pf_name}.jpg", "wb") as f:
			f.write(resp.content)
		print(f"正在保存{pf_name}")
		time.sleep(1)

标签：ename,王者,get,resp,荣耀,爬取,cname,pf,each
From： https://www.cnblogs.com/jzm123/p/17292491.html

python-爬虫-css提取-写入csv-爬取猫眼电影榜单
猫眼有一个电影榜单top100，我们将他的榜单电影数据（电影名、主演、上映时间、豆瓣评分）抓下来保存到本地的excle中本案例使用css方式提取页面数据，所以会用到以下库importtimeimportrequestsimportparsel#解析库，解析cssimportcsv#爬取的数据写入csv创建csv文件标头信息......
昨天学习了handler内容，使用代理爬取，然后我们做了电梯演讲
我们的团队项目为达梦云原生大数据平台的物流信息数据中台系统，【达梦云原生大数据平台的物流信息数据中台系统电梯演讲】：https://www.bilibili.com/video/BV1dL411S7sX/?share_source=copy_web&vd_source=b59650d02019776b8693b25978d3ff02......
爬虫实战(一)爬取静态页面数据
前言我们以一个静态网站作为案例进行练习，网站链接为:https://ssr1.scrape.center/，这个网站里面包含一些电影信息。网站首页如下图所示: 我们点击其中一部电影，会进入该电影的详情页面，如下图所示：我们需要爬取的信息为每部电影的名称、封面、类别、......
Python 爬虫模拟手机爬取听力资料
Python爬虫模拟手机爬取听力资料目录Python爬虫模拟手机爬取听力资料需求思路1使用Pyppeteer参考实现1测试模拟手机效果2爬取资源首页资源列表详情与音频以cha......
爬取院士名单以及简介
爬取院士名单以及简介续作人才及研究方向信息爬取爬虫-英飞-博客园(cnblogs.com)需求与思路需求：爬取经济管理相关国家级人才思路：1从title出发，比如中国科学......
python 批量爬取邮箱
python批量爬取邮箱地址#coding:utf-8importrequestsimportbs4#解析网页importlxmlimportreheaders={'User-Agent':'Mozilla/5.0(WindowsNT10.0;Win......
Quicker快速开发，简单的网页数据爬取（示例，获取天眼查指定公司基础工商数据）
前言有某个线上项目，没有接入工商接口，每次录入公司的时候，都要去天眼查、企查查或者其他公开数据平台，然后手动录入，一两个还好说，数量多了的重复操作就很烦，而且，部分数据是包含......
Python中使用requests和parsel爬取喜马拉雅电台音频
场景喜马拉雅电台：https://www.ximalaya.com/找到一步小说音频，这里以下面为例https://www.ximalaya.com/youshengshu/16411402/关注公众号霸道的程序猿获取编程相关电子书......
爬取的数据，存到mysql中、爬虫和下载中间件、加代理，cookie，header，加入selenium、去重规
目录0爬取的数据，存到mysql中1爬虫和下载中间件2加代理，cookie，header，加入selenium2.1加代理2.2加cookie,修改请求头，随机生成UserAgent2.3集成selenium3去重规则源码......
爬虫相关 scrapy架构介绍、scrapy解析数据、settings相关配置，提高爬取效率、持久化方
scrapy架构介绍#引擎(EGINE)引擎负责控制系统所有组件之间的数据流，并在某些动作发生时触发事件。#调度器(SCHEDULER)用来接受引擎发过来的请求,压入队列中,并在......

爬取王者荣耀皮肤并保存图片

相关文章

赞助商

阅读排行