首页 > 其他分享 >该方法实现网页编码的自动识别和转换

该方法实现网页编码的自动识别和转换

时间:2023-05-04 17:11:37浏览次数:34  
标签:编码 自动识别 网页 encoding utf gbk content codes return

"""
该方法实现网页编码的自动识别和转换
"""

# python 第三方库chardet不可靠,把gbk编码解析成 Windows-1254
@retry(stop_max_attempt_number=5, wait_random_min=2000, wait_random_max=20000, )
def page_trancode(content):

codes = chardet.detect(content)

if codes['encoding'] == "utf-8":
return content
if codes['encoding'] == "gbk":
return content.decode('gbk', 'ignore').encode('utf-8')
if codes['encoding'] in "GB2312":
return str(BeautifulSoup(content, 'html.parser', fromEncoding="GBK"))
if codes['encoding'] in "unicode":
return content.encode('utf-8').decode('unicode_escape')
else:
return content

标签:编码,自动识别,网页,encoding,utf,gbk,content,codes,return
From: https://www.cnblogs.com/xuchunlin/p/17371875.html

相关文章

  • Python网页应用开发神器fac 0.2.6版本重要新功能一览
    fac项目地址:https://github.com/CNFeffery/feffery-antd-components,欢迎star支持大家好我是费老师,距离我的开源Python网页应用通用组件库fac的0.2.0版本发布已过去半个多月的时间,在国内外众多fac用户的反馈建议下,经过高强度的优化和功能更新,目前fac已经更新到0.2.6版本,且......
  • 直播app开发搭建,图形和短信验证码的自动识别获取
    直播app开发搭建,图形和短信验证码的自动识别获取selenuim操作 driver=webdriver.Chrome()driver.get("https://locvps.wenjingnetwork.com/page.aspx?c=reg")driver.implicitly_wait(10)#设置超时时间driver.find_element_by_name("uname").send_keys()driver.find_element_by......
  • DER编码
    一、任务详情参考附件中图书p120中7.1的实验指导,完成DER编码Name实例中,countryName改为"CN",organizationName="你的学号"commonName="你的姓名拼音"用echo-n-e"编码">你的学号.der中,用OpenSSLasn1parse分析编码的正确性提交编码过程文档(推荐markdown格式)附件:PKI.C......
  • 看电影 app 和 网页
    1.影视工厂下载app......
  • PostGIS中获取所有EPSG的编码以及对应Proj4字符串
    场景PostGIS在Windows上的下载与安装:https://blog.csdn.net/BADAO_LIUMANG_QIZHI/article/details/124107198在上面安装好PostGIS后会默认生成一个spatial_ref_sys表,此表保存空间数据库中使用的坐标系统的数字ID和文本描述。 安装好之后就可以将其导出为需要的文件格式,或......
  • der编码
    任务详情参考附件中图书p120中7.1的实验指导,完成DER编码Name实例中,countryName改为"CN",organizationName="你的学号"commonName="你的姓名拼音"用echo-n-e"编码">你的学号.der中,用OpenSSLasn1parse分析编码的正确性提交编码过程文档(推荐markdown格式)附件:PKI.CA与数字证......
  • 机器学习预测给定生物DNA序列是编码序列还是非编码序列
    在生物学中,DNA序列通常指非编码序列,因为DNA是生物体内存储基因信息的一种生物大分子,具有一定的生物学特性和结构。然而,基于DNA序列的机器学习预测可以包括编码和非编码序列的任务。以下是一些基于DNA序列的机器学习应用:应用于非编码DNA序列的机器学习模型:基因预测:使用机器学习......
  • DER编码
    任务详情参考附件中图书p120中7.1的实验指导,完成DER编码Name实例中,countryName改为"CN",organizationName="你的学号"commonName="你的姓名拼音"用echo-n-e"编码">你的学号.der中,用OpenSSLasn1parse分析编码的正确性提交编码过程文档(推荐markdown格式)附件:PKI.CA与......
  • 数字证书编码ASN.1
    查看姓名、学号的16进制ASCII码echo-n"LiuJinming"|od-tc-tx1echo-n"20201327"|od-tc-tx1对TBSCertificate进行DER编码1.序列号1174(0x0496)2.证书签发者DN="CN=VirtualCA证书有效期=20200222000000-202202220000004.证书持有者DN=CN=LiuJinming,OU=Pers......
  • c# 流、文件、字符串与byte数组、字符编码
    c#中的流对象间进行信息或者数据的交换时总是先将对象或数据转换为某种形式的流,再通过流的传输,到达目的对象后再将流转换为对象数据。所以,可以把流看作是一种数据的载体,通过它可以实现数据交换和传输。流的特殊性在于它是动态的和线性的,动态是指数据的内容和时间有关,例如,在某......