首页 > 编程语言 >python爬取公众号文章发布时间

python爬取公众号文章发布时间

时间:2022-10-31 16:45:46浏览次数:46  
标签:-% date1 xpath python pat1 timeArray 爬取 公众

使用xpath取出来的是空,爬取到本地的html,时间的标签如下,内容也是是空的

<em id="publish_time" class="rich_media_meta rich_media_meta_text"></em>

经过查找发现网页使用的是时间戳,通过xpath获取时间戳

pat1 = r"var ct = \"(\d+)\""        
date1 = re.search(pat1, reponse).group(1)
date1 = int(date1)
#转换为其他日期格式,如:"%Y-%m-%d %H:%M:%S"
timeArray = time.localtime(date1)
otherStyleTime = time.strftime("%Y-%m-%d %H:%M:%S", timeArray)

标签:-%,date1,xpath,python,pat1,timeArray,爬取,公众
From: https://www.cnblogs.com/MrFlySand/p/16844402.html

相关文章

  • python-函数
    打算今天花三个小时学习一下python,要不然强化学习的很多内容看不懂一、参数1.形式参数和实际参数形式参数:定义函数的时候在括号中的参数,在函数内部会使用这个参数进......
  • 随机化算法解决圆排列问题 - python解法
    问题描述给定n个大小不等的圆,现要将这n个圆排进一个矩形框中,且要求各圆与矩形框的底边相切。圆排列问题要求从n个圆的所有排列中找出有最小长度的圆排列。例如,当n=3,且所给......
  • python中*的用法
    python中*是非常常见的一个运算符,它主要有以下几个功能:乘法运算符;函数形参表示可变参数;函数实参代表tuple;序列解包为tuple;zip解包运算;参考资料:​​Python3*和**运算符​......
  • python多继承及其super的用法
    python也具有多继承的功能,而同样的,大家能想到多继承必须要引入一些特定的方法来准确调用子类或基类的重载、重写的方法,否则会出现混乱。本文参考​​Multipleinheritance......
  • python中的round
    参考资料:​python的round函数使用​​python的round函数作用是四舍五入,其函数定义如下:round接收两个参数,第一个是数字,第二个是保留的位数,如果不显式给定第二位,则默认不保留......
  • 【python】list中extend和append的区别
    在python列表中,extend和append都可以往列表中加入元素,extend是扩充单个元素,如:a='abc123'b=[]b.extend(a)>>>b=['a','b','c','1','2','3']而append是扩......
  • 力扣409(java&python)-最长回文串(简单)
    题目:给定一个包含大写字母和小写字母的字符串 s ,返回 通过这些字母构造成的最长的回文串 。在构造过程中,请注意区分大小写。比如 "Aa" 不能当做一个回文字符串......
  • grpc demo python客户端 c++服务端
    项目需啊将网站上传的图片传入c++推理引擎,网站使用flask架构,python编写,图片推理引擎是一个单独的server,c++编写,因此用grpc来传输比较合适。理论上来说只要规定好proto文件,......
  • python爬虫基本概述
    python爬虫基本概述 一、爬虫是什么网络爬虫(Crawler)又称网络蜘蛛,或者网络机器人(Robots).它是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。换句话来说,它可......
  • linux安装python3.10
    1.下载python包https://www.python.org/ftp/python/3.10.5/Python-3.10.5.tgz2.安装依赖包yuminstall-ygccpatchlibffi-develpython-develzlib-develbzip2-dev......