首页 > 编程语言 >短网址解析长网址python示例

短网址解析长网址python示例

时间:2022-12-18 10:03:43浏览次数:44  
标签:示例 python list 网址 fA file dup txt


短网址解析长网址python示例_.net

做可视化比较麻烦我就没做,用文件处理的,这里需要两个文件

1、readUrl.txt文件保存需要解析的字符串

2、newUrl.txt文件保存解析完成的字符串

目录

​​readUrl.txt文件示例​​

​​编码示例: ​​

​​推荐获取网页URL的正则​​

​​解析结果newUrl.txt​​


编码示例: 

import requests
import re

file = open("readUrl.txt", "r", encoding="utf-8")
strListArr = file.readlines()
strList = "".join(strListArr)
file.close()
headers = {
"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/104.0.0.0 Safari/537.36"
}

rep="http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+"

listUrl = re.findall(rep, strList)

list_not_dup = list()
for i in listUrl:
if i not in list_not_dup:
list_not_dup.append(i)

for item in list_not_dup:
print(item)

strUrl = ""
for item in list_not_dup:
html = requests.get(item, headers).url
result = html.split("?")
strUrl += result[0] + "\n"

file = open("newUrl.txt", "w", encoding="utf-8")
file.write(strUrl)
file.close()

推荐获取网页URL的正则

"http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+" 

标签:示例,python,list,网址,fA,file,dup,txt
From: https://blog.51cto.com/laoshifu/5950775

相关文章

  • 走过岁月我才发现——云IDE真方便(Python3.8环境测试)
    目录​​产品测试:​​​​创建工作空间​​​​插件安装​​​​创建python文件​​​​运行python文件​​​​Demo测试​​​​查看环境piplist​​​​云IDE挑战赛​​......
  • 【python/pycharm】豆瓣top250电影
    学弟给的importreimportrequestsurl="https://movie.douban.com/top250"headers={'User-Agent':'Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/5......
  • python中实现保留几位小数的几种方式
    方式一:format()format(1.235,'.2f')Out[1]:'1.24'format(1.2,'.2f')Out[2]:'1.20'format(1.2,'.3f')Out[3]:'1.200'返回值为字符串类型,末位会自动补0......
  • 【python/pycharm】哆啦A梦
    #!/usr/bin/envpython3#-*-coding:utf-8-*-#@Author:dong#@Date:2018-07-0519:37:42#@Env:python3.6#@Github:https://github.com/PerpetualSmilef......
  • Python之⾯向对象-继承
    一、继承的概念⽣活中的继承,⼀般指的是⼦⼥继承⽗辈的财产。拓展1:经典类或旧式类不由任意内置类型派⽣出的类,称之为经典类。class类名:代码......拓展2:新式类class类名......
  • 开个坑,明天学点Gdb+Python脚本!!!! 22:13 2022年12月17日(星期六)
    写在前面我发现如果调试如果一直截图,其实对于我来说,需要找回当时的记忆,可以一声熬,才能拥有和当时一样的见解。最近心得以前没有记录的习惯,导致很多知识,比如defer的创......
  • 二分查找python与java实现
    定义给定以下情景,假设有一个有序的数组(从大到小排列),我们需要从中找出我们所需的目标元素并返回其索引。一般的思想是可以使用for循环进行遍历,直到找到目标元素......
  • C# Socket 使用简单测试示例
    引用Newtonsoft.Json.dllusingNewtonsoft.Json;进行对象序列化和反序列化。服务端:usingSystem;usingSystem.Collections.Generic;usingSystem.Linq;usingSyst......
  • Python - 习题练习(1-3)
    一、前言接下来通过一些习题练习下代码感,以及熟悉解题思路和基本函数使用,参考博客:https://www.cnblogs.com/poloyy/p/15255670.html二、习题实战1、open函数、字典.......
  • 【Python自动化框架pytest(三)--数据驱动(参数化)】
    参数化,就是把测试过程中的数据提取出来,通过参数传递不同的数据来驱动用例运行。其实也就是数据驱动的概念。在Unittest中,我们讲过使用ddt库配合unittest实现数据驱动......