首页 > 其他分享 >1.blackview_readme(项目一)

1.blackview_readme(项目一)

时间:2023-09-11 09:00:11浏览次数:39  
标签:txt 项目 url 源码 products readme blackview 链接

//F盘url.txt文件现在有几个链接,现在需要python程序爬取文件中所有链接的网页源码,并在这些网页源码中筛选包含/products/item/的链接,按字母或数字排序,去重后分别新建txt文件存储在F盘上。https://www.blackview.hk/

一、我现在想用python程序获取https://www.blackview.hk/这个url的网页源码,从源码中提取所有包含“products/”+数字的链接,将重复的链接去重,按字母或数字排序,然后写入F盘url.txt文件。

二、我现在想用python程序获取https://www.blackview.hk/products/58这个url的网页源码,从源码中提取所有包含"/products/item/"的链接,链接去重,按字母或数字排序,然后写入F盘url.txt文件。

三、我现在想用python程序获取https://www.blackview.hk/products/58这个url的网页源码,只保留class="goods-list"标签下的li标签下的a标签和p标签的内容,只保留内容,以逗号分隔,然后写入F盘url.txt文件,去除首尾的空字符或换行。

我现在想用python程序获取https://www.blackview.hk/products/58这个url的网页源码,只保留class="goods-list"标签下的内容,把完全不包含数字的行删除,然后写入F盘url.txt文件。

我现在想用python程序获取https://www.blackview.hk/products/58这个url的网页源码,只保留class="goods-list"标签下a标签的链接,且链接内容必须包含/products/item,去掉重复内容,并计算标签数写在首行,然后写入F盘url.txt文件。我现在想用python程序获取https://www.blackview.hk/products/item/tab12这个url的网页源码,只保留 class="left" class="right"或者class="li-tit"

class="li-msg"中的内容,去除首尾的空字符或换行然后写入F盘url.txt文件。

class="left"  class="right"  class="li-tit"  class="li-msg"

step1:

import requestsimport re

# 发起GET请求获取网页源码
url = 'https://www.blackview.hk/'
response = requests.get(url)
html = response.text

# 使用正则表达式提取所有符合条件的链接
pattern = r'<a\s+(?:[^>]*?\s+)?href="/products/(\d+)"'
links = re.findall(pattern, html)

# 去重链接
unique_links = list(set(links))

# 将链接写入文件
file_path = 'F:/url.txt'
with open(file_path, 'w') as file:
for link in unique_links:
file.write(f"{url}products/{link}\n")

print('链接已保存到', file_path)

step2:

import requests
from bs4 import BeautifulSoup

# 指定要获取源码的页面链接
url = 'https://www.blackview.hk/products/58'

# 发送GET请求以获取页面源码
response = requests.get(url)

# 从源码中提取包含“/products/item/”字符串的链接并去重
soup = BeautifulSoup(response.content, 'html.parser')
links = set()
for link in soup.find_all('a'):
href = link.get('href')
if href and '/products/item/' in href:
links.add(href)

# 根据链接内容进行排序
sorted_links = sorted(links, key=lambda x: (x.isdigit(), x))

# 将链接写入F盘url.txt文件
file_path = 'F:/url.txt'
with open(file_path, 'w', encoding='utf-8') as file:
for link in sorted_links:
file.write(link + '\n')

 

标签:txt,项目,url,源码,products,readme,blackview,链接
From: https://www.cnblogs.com/kamisamalz/p/17688261.html

相关文章

  • 嵌入式面经_20届师兄谈笔试_八股文_简历_项目经验分享
    嵌入式面经_20届师兄谈笔试_八股文_简历_项目经验分享111道嵌入式面试题答案汇总专栏链接-->《嵌入式/C++面试题解析大全》1、个人经历本人2020年毕业于广东工业大学研究生:许乔丹,有国内大厂CVTE和世界500强企业嵌入式/安卓开发经验,谈谈一些感想。2023都说前端后台卷死,相较2......
  • 用OLED屏幕播放视频(1): 项目介绍
    下面的系列文章记录了如何使用一块linux开发扳和一块OLED屏幕实现视频的播放:项目介绍为OLED屏幕开发I2C驱动使用cuda编程加速视频处理这篇文章主要对项目的实现做整体的介绍,包括硬件的需求,最终实现的视频播放效果,以及软件的实现思路.1).硬件需求beagleboneblack......
  • vue项目成功引入element组件的具体步骤
    1、首先要确保vue项目能够成功在浏览器访问2、一般使用的是vue3那么,需要注意的是,element组件在vue3里面,需要使用的是element-plus命令:npminstallelement-plus--save--legacy-peer-deps下载完成之后,需要在main.js里面对element组件进行引入:importElementPlusfrom'ele......
  • 运行vue项目一直报错的问题的解决
    问题描述(上图为网图,自己的没来得及截图)问题解决第一个原因:vue版本过低;使用下面的语句进行版本升级:[email protected]但是我试了没啥用;第二个原因:node版本过低;使用下面的语句进行版本升级:--若是已经有更高级的版本,可以直接更换:nvmlistnvmuse版本--若是没有,就自己......
  • 2023-09-10:用go语言编写。作为项目经理,你规划了一份需求的技能清单 req_skills, 并打算
    2023-09-10:用go语言编写。作为项目经理,你规划了一份需求的技能清单req_skills,并打算从备选人员名单people中选出些人组成一个「必要团队」(编号为i的备选人员people[i]含有一份该备选人员掌握的技能列表)。所谓「必要团队」,就是在这个团队中,对于所需求的技能列表req_skills......
  • 2023-09-10:用go语言编写。作为项目经理,你规划了一份需求的技能清单 req_skills, 并打算
    2023-09-10:用go语言编写。作为项目经理,你规划了一份需求的技能清单req_skills,并打算从备选人员名单people中选出些人组成一个「必要团队」(编号为i的备选人员people[i]含有一份该备选人员掌握的技能列表)。所谓「必要团队」,就是在这个团队中,对于所需求的技能列表req_sk......
  • Vue进阶(幺陆柒):Vue 项目调试技能
    (文章目录)一、前言在Vue项目开发过程中,当遇到应用逻辑出现错误,但又无法准确定位的时候,知晓Vue项目调试技巧至关重要。同后台项目开发一样,可以在JS实现的应用逻辑中设置断点,并进行单步、进入方法内、跳出方法等调试,从而准确定位问题根源。本文主要讲解针对JetBrains系列WebStor......
  • 多模块项目依赖中,项目启动失败-org.yaml.snakeyaml.error.YAMLException: java.nio.ch
    异常问题专栏收录该内容22篇文章1订阅订阅专栏错误:org.yaml.snakeyaml.error.YAMLException:java.nio.charset.MalformedInputException:Inputlength=1原因:yaml/yml配置文件解析失败解决:把项目编码(FileEncodings)全部设置为UTF-8,后重启IDEA软件;其中,若为多模块项目依......
  • 用vue开发新项目的前期步骤流程
     一、git代码托管平台1)注册登录:Gitee-基于Git的代码托管和研发协作平台2)在码云上传本地已存在项目:编辑编辑3)安装git::https://git-scm.com/4)克隆码云上的项目到本地:gitclone仓库地址5)搭建项目环境6)将代码上传到gitee.com的仓库中:git的使用,查看另外一篇文章二、搭建vue项目环......
  • 在springboot项目种引入element组件
    1、保证vue的版本在3以上2、Win+R--打开命令行窗口(cmd)输入下面的命令,打开图形化界面:vueui3、打开我们创建的vue项目选择路径即可自主导入项目;4、安装element-ui的插件依赖5、查看项目中是否存在ok!......