首页 > 编程语言 >python爬虫入门脚本示例

python爬虫入门脚本示例

时间:2023-02-02 10:08:00浏览次数:49  
标签:文件 示例 python list 爬虫 file path os 目录

例如在某个目录xx下,有个普通的文件,有些文件后缀*.txt,有的却没有后缀名。现在写一个程序希望将xx目录下没有后缀名的文件改成*.txt结尾。

知识点:需要用到python的os模块

直接上代码:

import os
def is_file(path): # 接收一个目录绝对路径
all = os.listdir(path) # os.listdir列出目录下所有的文件,目录,隐藏文件
file_list = [] # 文件列表
updata_file_list = [] # 更改的文件列表
for i in all:
path1 = os.path.join(path, i) # os.path.join将路径和i组合起来
if os.path.isfile(path1): # os.path.isfile判断是否为文件
file_list.append(os.path.basename(path1))
fiilname, suffix = os.path.splitext(path1) # 返回一个元组(文件路径,后缀名)
if not suffix: # 后缀名不存在
os.chdir(path) # 切换到path目录下
os.rename(i, i + '.txt')
updata_file_list.append(i + '.txt')
print('原目录里的文件(目录以排除):{}'.format(file_list))
print('更改后缀的文件:{}'.format(updata_file_list))

is_file(r'D:\python11_quanzhan\test\123') # 传一个目录的绝对路径

执行结果:(如图)

python爬虫入门脚本示例_绝对路径

总之一句话,日常工作中,多写多练,python的熟练度自然上去了......

标签:文件,示例,python,list,爬虫,file,path,os,目录
From: https://blog.51cto.com/u_13488918/6032794

相关文章

  • python 的钩子函数
    一、什么是钩子函数hook函数就是在一定条件下才会执行的函数,将自己实现的函数挂载到挂载点上1.hook函数:就是我们自己实现的函数,函数类型与挂载点匹配(返回值,参数列表)2.......
  • robotframe work中 自定义python library使用global variable
    在用robotframework的小伙伴,有没有遇到这样一个问题:  当你用python写一个libary时, 需要用到robotframe外面定义的globalvariable. 怎么处理?  这时一般人的做......
  • Python 异步集群使用
    目前在做Python项目用到同步和异步的方法使用Redis单机,现在要增加兼容Redis集群。也就说当前项目用到中以下4种Python使用Redis的方法都用到了。-同步异步单机......
  • python jwt
    jwt->jsonwebtoken一般用于前后端分离项目的用户认证。传统校验需要把token保存在服务端。而jwt不会保存在服务端,通过客户端给的token和算法进行验证。jwt包括三段......
  • python传递的值还是引用(即改变返回值或者参数值,是否影响本身)
    Python参数传递采用的是“传对象引用”的方式。这种方式相当于传值和传引用的一种综合。如果函数收到的是一个可变对象(比如字典或者列表或者类)的引用,就能修改对象的原始值......
  • 数据结构-详解优先队列的二叉堆(最大堆)原理、实现和应用-C和Python
    一、堆的基础1.1优先队列和堆优先队列(PriorityQueue):特殊的“队列”,取出元素顺序是按元素优先权(关键字)大小,而非元素进入队列的先后顺序。若采用数组或链表直接实现优......
  • 百度站长后台python推送工具
    需要在文件目录下面建一个urls.txt的文件,将所有要推送的url放到文本里。然后运行下面的脚本。importrequestsdefbaidu_push(url,token):headers={'......
  • python处理图片,往图片中写入汉字
    fromPILimportImage,ImageDraw,ImageFontdefadd_text_to_image(image_path,text,font_path,font_size,text_color):image=Image.open(image_path)......
  • python循环post数据
    importrequestsdefpost_data(url,data,count):foriinrange(count):response=requests.post(url,data=data)print(f"POSTrequest{i......
  • 用python把word转成pdf
    需要使用python-docx模块pipinstallpython-docx然后函数主体importosimportdocx2pdfdefword_to_pdf(file_path):pdf_file=file_path.replace(".docx"......