content = li.xpath('./div[1]/text()').extract_first()
title = li.xpath('./div[2]/a/text()').extract_first()
all_data = title+content
#生成该数据的数据指纹
import hashlib # 导入一个生成数据指纹的模块
m = hashlib.md5()
m.update(all_data.encode('utf-8'))
data_id = m.hexdigest()