首页 > 编程语言 >女同桌找我要表情包,还好我会Python,分分钟给她下载几十个G...

女同桌找我要表情包,还好我会Python,分分钟给她下载几十个G...

时间:2022-09-27 12:56:29浏览次数:55  
标签:... headers Python 同桌 content -- re requests 第一页

emmm~

起因呢,这昨晚女同桌跟我说电脑有点卡,喊我去宿舍给她装个新系统,装系统就装系统吧,结果又说新系统表情包都没保存~

我当时就有点生气,真当我是万能的呢?

于是我直接就用Python给她爬了几十个G,完事扭头就走,任她怎么喊我也没用!

 

一、准备工作

使用的环境

 

  • python3.8 | Anaconda
  • pycharm

使用的模块

 
  • requests 第三方模块 需要手动安装
  • re 内置模块不需要安装

 

win+r 输入cmd ,确定后新窗口输入 pip install requests 即可安装成功。

插件安装

xpath helper扩展工具包

安装步骤:找助理老师获取xpath helper扩展工具包(注意:不要解压)
》》 打开Google浏览器 --> 更多工具 --> 扩展程序 --> 打开开发者模式 --> 把xpath helper扩展工具包直接拖入 --> 刷新
使用方法:快捷键 ctrl+shift+X

思路流程

1、分析数据来源
第一页:https://fabiaoqing.com/biaoqing/lists/page/1.html
多页 —> 第一页 --> 一个
2、实现代码

  • 发送请求,第一页数据
  • 获取数据
  • 解析数据,表情
  • 保存数据

二、效果展示

部分效果展示

 

 

三、代码解析

1、发送请求

第一页数据

url = 'https://fabiaoqing.com/biaoqing/lists/page/1.html'
headers = {
    # 键值对  用户代理   浏览器的基本身份
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36'
}
response = requests.get(url, headers=headers)


# <Response [200]>  响应对象   200 状态  成功  404  403
print(response)

2、获取数据

网页源代码

print(response.text)

re 找规律

3、解析数据

.*? 精准匹配数据

re_data = re.findall('<img class="ui image lazy" data-original="(.*?)" src="/Public/lazyload/img/transparent.gif" title="(.*?)" ', response.text)
# print(re_data)

# for 循环
for img in re_data:
    # print(img)
    #索引 [0]  [1] ()
    # 单个表情包链接
    link = img[0]
    suffix = link.split('.')[-1]
    # print(suffix)
    # print(link)
    # 名字
    title = img[1]
    title = re.sub(r'[\/:*?"<>|]','',title)
    # 二进制
    content = requests.get(link, headers=headers).content
    # print(content)

  

4、保存数据

with open('表情包\\' + title +'.' +suffix, mode='wb') as file:
    file.write(content)

好了,今天的分享就到这里,喜欢的点点赞吧。

 

标签:...,headers,Python,同桌,content,--,re,requests,第一页
From: https://www.cnblogs.com/tuixiulaozhou/p/16723142.html

相关文章

  • python使用paramiko实现ssh定时执行命令
    原文https://www.cnblogs.com/Rosaany/p/16093521.html#!/usr/bin/envpython3#-*-coding:utf-8-*-#@Author:Rosaanyimportfunctoolsfromparamiko.ssh_exce......
  • Python 安装
    进入Python官网选择安装包根据自己需要选择安装包,这里我选用的是Python3.10.7的完整安装包Windowsinstaller(64-bit),注意:embeddable:表示绿色免安装版本,可......
  • python时间加减
      运行结果:  ......
  • python 实现发送邮件功能
    一、前言   在开始正题之前,我们先理一下常见的电子邮件协议: SMTP、POP、IMAP都遵循TCP/IP协议规范。至于Exchange是邮件服务器,不是收邮件和发邮件的协议,不要混淆概......
  • Python多行字符串
    Sometimeswehaveaverylongstringandwewanttowriteitintomultiplelinesforbettercodereadability.Pythonprovidesvariouswaystocreatemultiline......
  • python中利用smtplib发送邮件的3中方式 普通/ssl/tls
    #!/usr/bin/python#coding:utf-8importsmtplibfromemail.MIMETextimportMIMETextfromemail.Utilsimportformatdatefromemail.HeaderimportHe......
  • Linux升级python至3.x
    前言云服务器一般都用Linux系统,现在云服务器的Linux一般自带python,只是版本是2.x,比较老的那种。大部分人用的python应该都是3.x版本的,这时候你在本地编写的python文件拿到......
  • Python第四章实验报告
    一、实验题目Python第四章实例和实战作业二、实验目的和要求1.熟悉Pycharm的运行环境2.学习并掌握Python的流程控制语句三、主要仪器设备联想小新air15硬件:AMDR75......
  • 羊了个羊,但是Python简(li)单(pu)版
    大家好,欢迎来到Crossin的编程教室!要说最近最热门的游戏,那肯定是《羊了个羊》没跑了。连续上了好几天热搜,火到连央视都来提醒谨防有人利用游戏之名诈骗。但游戏爆火的另......
  • The Python Standard Library by Example pdf
    高清扫描版下载链接:https://pan.baidu.com/s/1XrEGFnmV_jwtkXILXLjUQg点击这里获取提取码 ......