首页 > 其他分享 >用正则提取返回的response.text中的项目名称和项目ID

用正则提取返回的response.text中的项目名称和项目ID

时间:2022-12-14 14:59:33浏览次数:42  
标签:项目 text object list response dict 3.0 2.0 ID

python request返回的response里面有这样的信息

想把项目名称和对应的id提取出来
可以用正则来提取

 

a = ' <a title="我的项目 2.0" href="https://www.tapd.cn/334332817186/?from=left_tree_v2"> <a title="他的项目 3.0" href="https://www.tapd.cn/1111332817186/?from=left_tree_v2">'

# 就提取名字
list_object = re.findall(r'<a title=\"(.*?)\"', a, re.S)
print(list_object) # 得到结果['我的项目 2.0', '他的项目 3.0']

# 提取名字和对应的id
list_object = re.findall(r'<a title=\"(.*?)\".*?href="https://www.tapd.cn/(.*?\d+)', a, re.S) # 取名字和连接
print(list_object) # 结果[('我的项目 2.0', '334332817186'), ('他的项目 3.0', '1111332817186')]

# 进一步,把结果 列表变成字典
dict_object = dict(list_object)
print(dict_object)
#{'我的项目 2.0': '334332817186', '他的项目 3.0': '1111332817186'} 

 

# 如果循环就是这样
dict_object = {}
for i in range(len(list_object)):

dict_object[list_object[i][0]]= list_object[i][1]
print(dict_object)
# {'我的项目 2.0': '334332817186', '他的项目 3.0': '1111332817186'}


标签:项目,text,object,list,response,dict,3.0,2.0,ID
From: https://www.cnblogs.com/felixlhp/p/16982133.html

相关文章