robots.txt 协议

君子协议

如果爬取了robots.txt 不允许被爬的东西，会封你IP，你还可以进局子。

可以在网站根目录下加上访问看下存在不，大网站一般是存在的。

百度翻译[练练手 UA 伪标]

# 作者：咸瑜
# 仅供学习使用！！！
import json

import requests

URL = "https://fanyi.baidu.com/sug"

# header UA 伪装
header = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/104.0.5112.81 Safari/537.36 Edg/104.0.1293.47'}

key = input("输入要翻译的单词：")
# 参数
data = {
    "kw": key
}

response = requests.post(url=URL, data=data, headers=header).json()

for item in response:
    if type(response[item]) == list:
        for listItem in response[item]:
            print('单词：', listItem['k'], '    中文翻译：', listItem['v'])

标签：data,爬虫,爬取,item,listItem,UA,response
From： https://www.cnblogs.com/bi-hu/p/16999468.html

【python爬虫课程设计】2022-23赛季欧洲冠军联赛——绘制球员数据柱状图和词云
一、选题的背景1.背景：2022-23赛季欧洲冠军联赛（2022–23UEFAChampionsLeague）由欧洲足球联合会主办的第68届欧洲足球俱乐部的顶级赛事，也是以欧洲冠军联赛名义下的第31届......
python爬虫-美团海底捞评论及评分数据爬取和分析
美团海底捞评论及评分数据爬取和分析一、选题背景通过网络请求的方式获取响应数据，再对获取的数据进行分析提取和汇总，并储存到xlsx表格中。在进入互联网存储海量数据......
[Jest] Override original module file with requireActual
jest.mock('./filename',()=>{constoriginalModule=jest.requireActual('./filename')return{...originalModule,fnA:jest.fn(),fnB:(b:b......
【进大厂大数据爬虫技术核心难点】纯前端开发的爬虫程序，很多BAT技术大咖都为之惊叹
创建index.html代码如下<!DOCTYPEhtml><htmllang="en"><head><metacharset="UTF-8"><metaname="viewport"content="width=device-width,initial-scale=1.0,......
【从零开始学爬虫】采集全国历史天气数据
l 采集网站【场景描述】采集全国历史天气数据。【源网站介绍】天气后报网提供全国历史天气查询、历史天气预报温度记录查询，历史天气数据包含全国各城市区县的最高温度、......
Horizon 8 测试环境部署(9): UAG 负载均衡配置-3
自上次发布一系列Horizon相关文章后，随着产品变化，部分产品的配置方式也有变化。接下来两篇文章将讲述两种新的UAG负载均衡配置方式，作为对原来文章的补充。UAG负载均衡配......
《Quarkus实战》总结
《Quarkus实战》总结目录一、优势二、搭建脚手架三、Rest1）启用跨源资源共享2）拦截HTTP请求3）使用SSL进行安全连接四、配置1）以程序化的方式访问配置属性2）在外......
Visual Studio Code 安装教程
VisualStudioCode介绍VisualStudioCode是一款非常轻量的前端代码编写工具，也是目前比较主流的。其中还包含了丰富的插件市场、非常好看的界面风格、可在软件内直接使......
Visual Studio Code 安装教程
VisualStudioCode介绍VisualStudioCode是一款非常轻量的前端代码编写工具，也是目前比较主流的。其中还包含了丰富的插件市场、非常好看的界面风格、可在软件内直接使......
关于python网络爬虫——摘取新闻标题及链接
Python是最近流行的编程语言，最近学习了python编程，并在网络爬虫方面进行了研究，下面给出简单实例来实现网络信息的获取步骤一：要有python开发环境，可下载python3.5版本，或anacond......

爬虫1 认识和基本爬取UA伪装

robots.txt 协议

百度翻译[练练手 UA 伪标]

相关文章

赞助商

阅读排行