短网址解析长网址python示例

时间：2022-12-18 10:03:43浏览次数：47

标签：示例 python list 网址 fA file dup txt

短网址解析长网址python示例_.net

做可视化比较麻烦我就没做，用文件处理的，这里需要两个文件

1、readUrl.txt文件保存需要解析的字符串

2、newUrl.txt文件保存解析完成的字符串

readUrl.txt文件示例

编码示例：

推荐获取网页URL的正则

解析结果newUrl.txt

编码示例：

import requests
import re

file = open("readUrl.txt", "r", encoding="utf-8")
strListArr = file.readlines()
strList = "".join(strListArr)
file.close()
headers = {
    "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/104.0.0.0 Safari/537.36"
}

rep="http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+"

listUrl = re.findall(rep, strList)

list_not_dup = list()
for i in listUrl:
    if i not in list_not_dup:
        list_not_dup.append(i)

for item in list_not_dup:
    print(item)

strUrl = ""
for item in list_not_dup:
    html = requests.get(item, headers).url
    result = html.split("?")
    strUrl += result[0] + "\n"

file = open("newUrl.txt", "w", encoding="utf-8")
file.write(strUrl)
file.close()

推荐获取网页URL的正则

"http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*,]|(?:%[0-9a-fA-F][0-9a-fA-F]))+"

标签：示例,python,list,网址,fA,file,dup,txt
From： https://blog.51cto.com/laoshifu/5950775

走过岁月我才发现——云IDE真方便(Python3.8环境测试)
目录产品测试：创建工作空间插件安装创建python文件运行python文件Demo测试查看环境piplist云IDE挑战赛......
【python/pycharm】豆瓣top250电影
学弟给的importreimportrequestsurl="https://movie.douban.com/top250"headers={'User-Agent':'Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/5......
python中实现保留几位小数的几种方式
方式一：format()format(1.235,'.2f')Out[1]:'1.24'format(1.2,'.2f')Out[2]:'1.20'format(1.2,'.3f')Out[3]:'1.200'返回值为字符串类型，末位会自动补0......
【python/pycharm】哆啦A梦
#!/usr/bin/envpython3#-*-coding:utf-8-*-#@Author:dong#@Date:2018-07-0519:37:42#@Env:python3.6#@Github:https://github.com/PerpetualSmilef......
Python之⾯向对象-继承
一、继承的概念⽣活中的继承，⼀般指的是⼦⼥继承⽗辈的财产。拓展1：经典类或旧式类不由任意内置类型派⽣出的类，称之为经典类。class类名:代码......拓展2：新式类class类名......
开个坑，明天学点Gdb+Python脚本！！！！ 22:13 2022年12月17日（星期六）
写在前面我发现如果调试如果一直截图，其实对于我来说，需要找回当时的记忆，可以一声熬，才能拥有和当时一样的见解。最近心得以前没有记录的习惯，导致很多知识，比如defer的创......
二分查找python与java实现
定义给定以下情景，假设有一个有序的数组（从大到小排列），我们需要从中找出我们所需的目标元素并返回其索引。一般的思想是可以使用for循环进行遍历，直到找到目标元素......
C# Socket 使用简单测试示例
引用Newtonsoft.Json.dllusingNewtonsoft.Json;进行对象序列化和反序列化。服务端：usingSystem;usingSystem.Collections.Generic;usingSystem.Linq;usingSyst......
Python - 习题练习（1-3）
一、前言接下来通过一些习题练习下代码感，以及熟悉解题思路和基本函数使用，参考博客：https://www.cnblogs.com/poloyy/p/15255670.html二、习题实战1、open函数、字典.......
【Python自动化框架pytest(三)--数据驱动（参数化）】
参数化，就是把测试过程中的数据提取出来，通过参数传递不同的数据来驱动用例运行。其实也就是数据驱动的概念。在Unittest中，我们讲过使用ddt库配合unittest实现数据驱动......

短网址解析长网址python示例

编码示例：

推荐获取网页URL的正则

相关文章

赞助商

阅读排行