我一直在做分析小红书热门笔记,用于创作自己的笔记内容。 为了想知道什么样的笔记封面更受欢迎。 我就用 功能很简单,执行这一段代码之后,便可得到热门top100的小红书笔记封面。 注意哦,这里是指定关键词的热门笔记。 也就是说,你想要做哪一类的笔记,只需要输入对应关键词,就可得到这一类最热门笔记的封面。 下面就是代码和执行代码后获得的笔记封面。 我在先前写过如何获取小红书关键词搜索数据采集的功能。 在那一个功能中,实现了小红书关键词搜索结果的数据采集。 在这一个功能中,我就用到了从那里采集到的数据。 实现这个功能,我们只需要提取数据集中的封面 最后,只需要将资源保存为图片文件即可。 这里是操作数据集的代码,关键点是提取数据集中的封面 其他就是很简单的操作。 在这段代码中我用到了几个 用的都是很基础的功能。 这一功能可以帮助我们拿到小红书关键词搜索的封面。 它们都是对应关键词中最热门笔记的封面。如果自己想发一款受欢迎的小红书笔记。 自己发小红书时,封面如何设计,就可以参考这些受欢迎的封面。 最后,祝你也能写出爆款小红书笔记。功能、效果说明
python
写了个批量下载热门笔记封面的工具。效果演示
实现思路
url
地址,然后借助requests
库的get
方法,发送http
请求,就能拿到图片资源。实现代码
url
。import csv
import json
import requests
import os
def pic_get():
csv_name = input('请输入要读取的文件 \n')
file = './' + csv_name + '.csv'
count = 0
# 创建文件夹
os.mkdir(csv_name)
with open(file, encoding='utf-8-sig') as f:
for row in csv.reader(f, skipinitialspace=True):
if(count > 0):
# print(row)
# 提取封面url
url = row[5]
json_str = url.replace("'", '"')
# json.loads() ,要求json串格式中必须的双引号!!转换为字典
json_dict = json.loads(json_str)
print(json_dict['url'])
req = requests.get(json_dict['url'])
# 写入文件
open(csv_name+'/'+str(count)+'.jpg','wb').write(req.content)
count += 1
f.close()
if __name__ == '__main__':
pic_get()实现原理
python
库。csv
、json
、requests
、os
csv
库用来读取csv
文件中的数据。json
库用来将读取到的csv
文件数据进行json
格式转换,方便获取图片url数据。requests
库用来发送get
请求,请求得到图片资源。os
库用来创建目录,用于分类保存图片文件。总结与拓展