爬取豆瓣电影，保存到json文件中

时间：2023-09-30 19:55:06浏览次数：44

标签：url res request urllib 爬取 headers json 豆瓣 file

import urllib.request

url = 'https://movie.douban.com/j/chart/top_list?type=5&interval_id=100%3A90&action=&start=0&limit=20'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.110 Safari/537.36 Edg/96.0.1054.62',
}
request = urllib.request.Request(url=url,headers=headers)
res = urllib.request.urlopen(request)
content = res.read().decode('utf-8')

file = open('movie.json','w',encoding='utf-8')
file.write(content)

　　获取豆瓣电影1-10页

import urllib.request
import urllib.parse
def getMovieTest(page):
    data = {
        'start':(page - 1) * 20,
        'limit':20
    }
    reqData =urllib.parse.urlencode(data)
    url = 'https://movie.douban.com/j/chart/top_list?type=5&interval_id=100%3A90&action=&' + reqData
    print(url)
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.110 Safari/537.36 Edg/96.0.1054.62',
    }
    request = urllib.request.Request(url=url, headers=headers)
    res = urllib.request.urlopen(request)
    content = res.read().decode('utf-8')
    file = open('moviessqw' + str(page) + '.json', 'w', encoding='utf-8')
    file.write(content)
    file.close()
for i in range(1,11):
    getMovieTest(i)

标签：url,res,request,urllib,爬取,headers,json,豆瓣,file
From： https://www.cnblogs.com/sgj191024/p/17738154.html

Go每日一库之186：sonic（高性能JSON库)
介绍我们在日常开发中，常常会对JSON进行序列化和反序列化。Golang提供了encoding/json包对JSON进行Marshal/Unmarshal操作。但是在大规模数据场景下，该包的性能和开销确实会有点不够看。在生产环境下，JSON序列化和反序列化会被频繁的使用到。在测试中，CPU使用率接近10%，其中极端情况......
爬虫记录~（多线程爬取图片）
使用Requests+Re库方法多线程爬取亚马逊商城商品图片，以关键词“书包”搜索页面的商品的图片，爬取0-2页面商品图片。关键词：多线程爬虫程序、商城网站的遍历，链接的查找和访问。巩固搜索接口和翻页处理。importrequestsfromfake_useragentimportUserAgentimportrefrommulti......
Mac部署Python语言json模块（Anaconda）
本文介绍在Mac电脑的Anaconda环境中，配置Python语言中，用以编码、解码、处理JSON数据的json库的方法；在Windows电脑中配置json库的方法也是类似的，大家可以一并参考。 JSON（JavaScriptObjectNotation）是一种轻量级的数据交换格式，常用于数据的序列化和传输。而Python中的json库，......
对象转JSON 遇到的BigDecimal 科学计数法的问题，json转化字段单独处理
问题描述：项目需要发送JSON数据，BigDecimal转成json仍然显示科学计数法，如果使用BigDecimai的toPlainString()需要将数据格式转为String，所以找了一下fastjson的自定义序列化内容，记录一下，以免以后忘记解决方案：方案一：JSONObject.toJSONString(vo,SerializerFeature.WriteBigDecimalA......
VScode对于json格式文件允许添加注释设置（永久有效）
如果你想让VSCode永久地将所有的.json文件都识别为JSONC，你可以通过修改VSCode的全局设置来实现。以下是具体步骤：在VSCode中按下Ctrl+,来打开设置（或者在菜单中选择"File"->"Preferences"->"Settings"）。在搜索框中输入“files.associations”。在"Files:Associations......
SyntaxError: "undefined" is not valid JSON
今天在写组件的一个接受JSON字符串的prop时，不知道为什么会报以下错误。file:[console]SyntaxError:"undefined"isnotvalidJSONfile:[Example.vue]<SVGv-if="data.length"v-for="itemindata":width="item.width":height="item......
xStream完美转换XML、JSON
xStream框架xStream可以轻易的将Java对象和xml文档相互转换，而且可以修改某个特定的属性和节点名称，而且也支持json的转换；前面有介绍过json-lib这个框架以及Jackson这个框架它们都完美支持JSON，但是对xml的支持还不是很好。一定程度上限制了对Java对象的描述，不能让xml完全体现到对Java......
json
JSON(JavaScript ObjectNotation)是一种轻量级的数据交换格式。它基于ECMAScript的一个子集。JSON采用完全独立于语言的文本格式，但是也使用了类似于C语言家族的习惯（包括C、C++、C#、Java、JavaScript、Perl、Python等）。这些特性使JSON成为理想的数据交换语言。易于人阅读和编......
python爬取手机壁纸
无聊随便玩玩，要爬成功还早着呢，代码很乱可以整理，写了就记录一下吧，有机会再改。importrequestsimportosfrombs4importBeautifulSoupfromrequests.packagesimporturllib3importrandomimportthreadingimporttimeurllib3.disable_warnings()start_page=1end_......
fastjson parseobject typereference - 指定泛型类型
Fastjson是一种Java中非常流行的JSON解析库，它可以将JSON字符串转换为Java对象。其中，parseObject方法是Fastjson提供的一种将JSON字符串解析为Java对象的方法，而TypeReference是Java泛型中的一个类，可以用于指定泛型类型，例如List、Map<String,Integer>等等。当我们使用parseObject......

爬取豆瓣电影，保存到json文件中

相关文章

赞助商

阅读排行