首页 > 其他分享 >day07 自定义模块&常见内置模块

day07 自定义模块&常见内置模块

时间:2022-11-24 13:55:26浏览次数:41  
标签:自定义 day07 list text 模块 path print import data

什么是模块和包?

  • 模块,就是指py文件,我们可以将一些功能按照某个维度划分

    自定义
    内置
    第三方
    
  • 包,就是指文件夹

    里面包含多个py文件
    

一般情况下,大家平时的讨论和沟通时,一般都统称为:模块

接下来我们要学习模块和包时:

  • 自定义模块和包 + 使用
  • 常见内置模块 + 使用
  • 第三方模块 + 使用

1. 自定义模块和包

1.1 快速上手

gx_day07
├── app.py
└── utils.py
# app.py
# 1.导入utils模块
import utils
choice = input("请输入序号:")

# 2.调用utils模块中的str_to_int功能。
res = utils.str_to_int(choice)
if res == None:
    print("输入错误")
else:
    msg = "序号是:{}".format(res)
    print(msg)
# utils.py
def str_to_int(str_data):
    """
    字符串转换为整形
    :param str_data: 要转换的字符串
    :return: 整形 or None(无法转换)
    """
    if str_data.isdecimal():
        return int(str_data)
    return None

示例2:

gx_day07
├── app.py
├── commons
│   ├── pager.py
│   └── pool.py
└── utils.py
# app.py 

# 导入
import utils

import commons.pager
import commons.pool

# 调用
v1 = commons.pager.pppppppp()
print(v1)

v2 = commons.pool.ooooooooo()
print(v2)

v3 = utils.str_to_int("123123")
print(v3)

1.2 关于模块和包的导入路径

上述的案例中,我是把包和模块都放在:

  • 运行文件所在的同级目录【导入成功】
  • 模块和包在Python的安装目录【导入成功】

如果我想要把某个模块放在 F:\code\hello.py,导入到我的项目里来,默认一定是无法导入的,这是因为Python内部在 import xxx 时会自动去某一些目录中寻找

import sys
print(sys.path) #这些目录就是当导入模块时python去寻找的路径

[
    '/Users/wupeiqi/PycharmProjects/gx_day07', 
    '/Users/wupeiqi/PycharmProjects/gx_day07', 
    '/Applications/PyCharm.app/Contents/plugins/python/helpers/pycharm_display', 
    '/Library/Frameworks/Python.framework/Versions/3.9/lib/python39.zip', 
  '/Applications/PyCharm.app/Contents/plugins/python/helpers/pycharm_matplotlib_backend'
]

以上了解后,如果你需要让python导入模块是去自定义的目录中寻找,那么你就需要:

import sys

# 1.自定义文件所在的目录添加到sys.path
sys.path.append(r"F:\code")

问题:sys.path获取到的是个什么?

是个列表,列表是有序的,python找到后就会停止寻找后面的路径
[
    '/Users/wupeiqi/PycharmProjects/gx_day07', 
    '/Users/wupeiqi/PycharmProjects/gx_day07', 
    '/Applications/PyCharm.app/Contents/plugins/python/helpers/pycharm_display', 
    '/Library/Frameworks/Python.framework/Versions/3.9/lib/python39.zip', 
    '/Library/Frameworks/Python.framework/Versions/3.9/lib/python3.9', 
]

注意:千万不要让自己的模块名称和python内置模块的名称同名(此时你想去调用Python内置的模块中的功能时,无法调用)

1.3 关于模块和包的导入方式

1.3.1 import导入

  • 导入一个py文件
import utils
utils.u_f1()

import commons.pager
commons.pager.p_1()

1.3.2 from导入

  • 导入级别:py文件中的函数
  • 导入级别:导入一个py文件
from utils import u_f1
u_f1()

from commons.pager import p_1
p_1()

from commons import pager
pager.p_1()
from commons.pager import p_1, p_2, p_3
from commons.pager import *

p_1()
p_2()
p_3()
p_4()
from commons.pager import p_1 as p2

p2()

答疑:

import 和 from 两种方式都是导入模块,效果上相同。一般情况下:
- 多个层级
	from commons.xxx.xxx import sdf
- 单层目录(与运行的py文件在同级目录)
	import xx

补充:主文件

def run():
    print(123)


# 当你在运行当前脚本时,__name__ 是Python内部会创建一个变量 __name__ = "__main__"
# 如果当前的脚本,是被别人导入执行的,Python在这个脚本的内部会创建 __name__ = "app"
if __name__ == '__main__':
    run()

注意:标志;防止别人导入就执行程序,只有主动执行才可以。

2.常见的内置模块

Python内部提供好的功能

2.1 hashlib

是一个对数据进行加密的模块

import hashlib

data = "admin"
obj = hashlib.md5()
obj.update(data.encode('utf-8'))
res = obj.hexdigest()
print(res)

在以后开发项目时,密码不要用明文存储

wupeiqi,21232f297a57a5a743894a0e4a801fc3

为了防止数据库泄露,用户名和密码全都泄露

2.1.1 密文匹配(不能反解)

MD5加密,不可反解

admin    ->   21232f297a57a5a743894a0e4a801fc3

案例:以后登录时要进行密文匹配

user_dict = {
    "wupeiqi":"21232f297a57a5a743894a0e4a801fc3"
}

user = input("用户名:") # wupeiqi
pwd = input("密码:") # admin

db_pwd = user_dict.get(user) # 21232f297a57a5a743894a0e4a801fc3
# 将 pwd 进行加密的到密文:21232f297a57a5a743894a0e4a801fc3

2.1.2 撞库

有些人搞一些机器跑,把明文的密文跑出来存放在库中,通过匹配的方式解密md5

admin	adfasdfasdfasdf
123		asdfadfasdfasdfasdf
ffsdf   asdfadfasdfasdfasdf

2.1.3 加盐

import hashlib

data = "admin"
salt = "asidfjaksdkjasdiuofiqjskda91qw3asdf"
obj = hashlib.md5(salt.encode('utf-8'))
obj.update(data.encode('utf-8'))
res = obj.hexdigest()
print(res) # c06b63d965921fe0a8803071b623e4e9

案例:用户注册和用户登录

用户注册案例:

import hashlib

DB_FILE_PATH = "db.txt" 
SALT = "asidfjaksdkjasdiuofiqjskda91qw3asdf"


def md5(data_string):
    obj = hashlib.md5(SALT.encode('utf-8'))
    obj.update(data_string.encode('utf-8'))
    res = obj.hexdigest()
    return res


def login():
    """ 登录 """
    print("用户登录")
    user = input("用户名:")
    pwd = input("密码:")
    encrypt_pwd = md5(pwd)

    # 逐行读取文件中的内容,来进行比较
    is_success = False
    with open(DB_FILE_PATH, mode='r', encoding='utf-8') as file_object:
        for line in file_object:
            data_list = line.strip().split(',')
            if data_list[0] == user and data_list[1] == encrypt_pwd:
                is_success = True
                break

    if is_success:
        print("登录成功")
    else:
        print("登录失败")


def register():
    """ 注册 """
    print("用户注册")
    user = input("用户名:")
    pwd = input("密码:")
    encrypt_pwd = md5(pwd)

    line = "{},{}\n".format(user, encrypt_pwd)
    with open(DB_FILE_PATH, mode='a', encoding='utf-8') as file_object:
        file_object.write(line)


def run():
    func_dict = {
        "1": register,
        '2': login
    }

    print("1.注册;2.登录")
    choice = input("序号:")
    func = func_dict.get(choice) #不匹配会返回None
    if not func:
        print("序号选择错误")
        return
    func()
    
run()

2.2 random

帮助我们生成一些随机数据

import random

v1 = random.randint(1, 20)  # 大于等于1; 小于等于20
print(v1)

案例:

import random

data_list = ["陈青", "邓新成", "谢鹏", "梁世斌"]

# 获取随机索引值 
idx = random.randint(0, len(data_list) - 1)

# 调用列表的pop功能,将列表中的某个索引位置的元素删除,并将删除的那个值获取到
element = data_list.pop(idx)

print(element)
print(data_list)
import random

char_list = []
for i in range(6):
    num = random.randint(65, 90)
    char = chr(num) #返回ascii码对应的字符
    char_list.append(char)

res = "".join(char_list)
print(res)

random模块中的其他常用功能:

import random

# 1.获取随机的整数
v1 = random.randint(1, 20)  # 大于等于1; 小于等于20
print(v1)

# 2.获取随机的小数
v2 = random.uniform(1, 10)
print(v2)

# 3.随机抽取1个数
data_list = [11, 22, 33, 44, 55]
v3 = random.choice(data_list)
print(v3)

# 4.随机抽取多个数
data_list = [11, 22, 33, 44, 55]
v4 = random.sample(data_list, 3)
print(v4)

# 5.打乱顺序
num_list = [i for i in range(100)]
random.shuffle(num_list)
print(num_list)

案例:年会抽奖案例

import random

# 1.创建300名员工
user_list = ["工号-{}".format(i) for i in range(1, 301)]

# 2.奖项信息
data_list = [
    ("三等奖", 5),
    ("二等奖", 3),
    ("一等奖", 2),
    ("特等奖", 1)
]

# 3.抽奖
for item in data_list:

    text = item[0]
    count = item[1]
    # 抽取count个员工,恭喜他们获得 ["工号1",...]
    lucky_user_list = random.sample(user_list, count)
    for name in lucky_user_list:
        user_list.remove(name)

    user_string = "、".join(lucky_user_list)
    message = "荣获{}的名单:{}。".format(text, user_string)
    print(message)
    if text !="特等奖":
        input("点击回车,继续抽奖:")

2.3 json

本质上:是一种数据格式,字符串形式

用处:让不同编程语言之间实现数据传输

JSON格式:

  • 外部整体为大的字符串

  • json字符串的内部如果有字符串的话,一定需要用双引号

  • json字符串中不会存在python中的元组那样的格式

    info = {'k1':123,'k2':(11,22,33,44)}
    
    JSON格式:
    	'{"k1":123,"k2":[11,22,33,44] }'
    

以下哪些数据是JSON格式的字符串:

v1 = '{"k1":123,"k2":456}'
v2 = "{'k1':123,'k2':456}"
v3 = '{"k1":123,"k2":456,"k3":[11,22,33]}'
v4 = '{"k1":123,"k2":456,"k3":(11,22,33)}'
# v1 v3
import json

info = {'k1': 123, 'k2': (11, 22, 33, 44)}
# python的数据类型转换为JSON格式的字符串
res = json.dumps(info)
print(res) # '{"k1": 123, "k2": [11, 22, 33, 44]}'
import json

data_string = '{"k1": 123, "k2": [11, 22, 33, 44]}'
# 将JSON格式的字符串转换为Python的数据类型
res = json.loads(data_string)
print(res) #{'k1': 123, 'k2': [11, 22, 33, 44]}

补充:还有json.load和json.dump,是对文件的操作

2.3.1 关于中文

import json

info = {"name": "邱恩婷", "age": 19}

v1 = json.dumps(info, ensure_ascii=False) #若为True,则会将中文字符进行ascii编码
print(v1) # '{"name": "邱恩婷", "age": 19}'

2.3.2 序列化

在Python中默认只能通过json模块序列化基本的数据类型

    +-------------------+---------------+
    | Python            | JSON          |
    +===================+===============+
    | dict              | object        |
    +-------------------+---------------+
    | list, tuple       | array         |
    +-------------------+---------------+
    | str               | string        |
    +-------------------+---------------+
    | int, float        | number        |
    +-------------------+---------------+
    | True              | true          |
    +-------------------+---------------+
    | False             | false         |
    +-------------------+---------------+
    | None              | null          |
    +-------------------+---------------+

需要把数据转换成可以序列化的json格式

import json
import decimal

data = decimal.Decimal("0.3")
res = float(data)

info = {"name": "邱恩婷", "age": 19.5, 'f': True, "hobby": None, "data": res}

v1 = json.dumps(info, ensure_ascii=False)
print(v1)

案例:豆瓣热门电影

案例1:基于requests模块向豆瓣发送请求获取热门电影

import json
import requests

res = requests.get(
    url="https://movie.douban.com/j/search_subjects?type=movie&tag=%E7%83%AD%E9%97%A8&sort=recommend&page_limit=20&page_start=20",
    headers={
        "user-agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.69 Safari/537.36"
    }
)

data_dict = json.loads(res.text) #res.text得到的是json格式的字符串

for item in data_dict['subjects']:
    print(item['title'], item['url'])

案例:写一个网站

案例2:用Python写一个网站,给Java程序提供数据支持

pip install flask
import json
from flask import Flask

app = Flask(__name__)


@app.route('/get/info')
def index():
    data = ['武沛齐', '郭智', '住户费']
    json_string = json.dumps(data, ensure_ascii=False)  # 也可以直接转换列表
    return json_string 

@app.route('/do/play')
def play():
    info = {
        "code": 1000,
        'status': True,
        'values': [
            {"id": 1, "name": "武沛齐"},
            {"id": 2, "name": "陈青"},
            {"id": 3, "name": "梁树彬"},
        ]
    }
    json_string = json.dumps(info, ensure_ascii=False)  # JSON格式的字符串
    return json_string

if __name__ == '__main__':
    app.run()

2.4 time

import time

# 1.获取当前的时间戳 (自1970年1月1日开始)
v1 = time.time()
print(v1)  # 1636956070.0133471 / 1636956095.6416771

案例:

import time

start_time = time.time()

...
....

end_time = time.time()

interval = end_time - start_time
print(interval)
import time
# 2.停止N秒,再继续运行
while True:
    print(1)
    time.sleep(1)

2.5 datetime

  • datetime格式

    import datetime
    
    v1 = datetime.datetime.now()
    print(v1)  # datetime类型
    
  • 字符串格式

    import datetime
    
    ctime_string = datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S")
    print(ctime_string)
    

案例:用户注册+时间

  1. 用户注册

    • while循环,输入:用户名、密码

    • 密码-> md5加密 -> 密文

    • 当前时间,用户注册时间

    • 写入到db.txt文档中

      user,pwd,时间
      
    """
    	需要写成函数的情况:
        	1. 代码复用
        	2. 代码太长,拆分到不同的函数
    """
    import hashlib
    import datetime
    
    def md5(data_string):
        obj = hashlib.md5()
        obj.update(data_string.encode('utf-8'))
        return obj.hexdigest()
    
    def run():
        while True:
            user = input("用户名:")
            password = input("用户名:")
            encrypt_password = md5(password)
            ctime_string = datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S")
    
            line = "{},{},{}\n".format(user, encrypt_password, ctime_string)
    
            with open('db.txt', mode='a', encoding='utf-8') as f:
                f.write(line)
    
    run()
    

案例:日志,根据时间写到不同文件

  1. 日志记录器,按分钟的维度来创建文件,并将内容写入到文件中

    • 写一个函数,在函数中实现这个功能

    • 在函数里面

      • 循环让用户输入:文本

      • 需要将文本写入到文件中

      import datetime
      
      def run():
          while True:
              text = input(">>>")
              ctime_string = datetime.datetime.now().strftime("%Y-%m-%d-%H-%M")
              file_name = "{}.txt".format(ctime_string)
              f = open(file_name, mode='a', encoding='utf-8')
              f.write("{}\n".format(text))
              f.close()
      
      run()
      

2.5.1 时间转换

  • 字符串 -> datetime类型

    from datetime import datetime
    text = "2021-11-11"
    res = datetime.strptime(text, "%Y-%m-%d") #按照text来书写格式
    print(res,type(res)) #2021-11-11 00:00:00 <class 'datetime.datetime'>
    
  • datetime -> 字符串

    from datetime import datetime
    
    dt = datetime.now()
    res = dt.strftime("%Y-%m-%d-%H-%M")
    print(res)
    
  • 时间戳 -> datetime类型

    import time
    from datetime import datetime
    
    ctime = time.time()
    dt = datetime.fromtimestamp(ctime)
    print(dt, type(dt)) #2022-11-17 09:48:44.999683 <class 'datetime.datetime'>
    
  • datetime类型 -> 时间戳

    from datetime import datetime
    
    v1 = datetime.now()
    res = v1.timestamp()
    print(res) #1668649752.520627
    

2.5.2 datetime类型的意义

from datetime import datetime, timedelta

v1 = datetime.now()
res = v1 + timedelta(days=10, hours=20, minutes=10, seconds=100)
print(res, type(res))

很方便的可以帮我们处理时间加减

2.6 os

  • 路径的拼接

    window系统:  C:\xx\xxx\xxx
       Mac系统:  /user/xxx/xxx/xxx
     Linux系统:  /user/xxx/xxx/xxx
    
    import os
    
    path = os.path.join("x1","x2","x3","x4",'log.txt')
    print(path) # x1/x2/x3/x4/log.txt 
    
  • 找到上级目录

    import os
    
    file_path = "x1/x2/x3/x4"
    
    # 找到当前路径的上一级目录
    v1 = os.path.dirname(file_path)
    print(v1) # x1/x2/x3
    
  • 绝对路径

    绝对路径:
    	/Users/wupeiqi/PycharmProjects/gx_day07/2021-11-15-15-10.txt
    相对路径(当前执行的程序)
    如何生成一个绝对路径
    import os
    
    res = os.path.abspath("xx")
    
    # 当前程序所在目录                             相对目录
    # /Users/wupeiqi/PycharmProjects/gx_day07/   xx
    print(res)
    
  • 判断路径是否存在

    import os
    
    res = os.path.exists(file_path)
    print(res) # True/False
    
    import os
    
    # files/db.txt
    file_path = os.path.join('files', 'db.txt')
    
    # 判断路径是否存在
    if os.path.exists(file_path):
        # 读取文件时,如果文件不存在就会报错:FileNotFoundError
        f = open(file_path, mode='r', encoding='utf-8')
        data = f.read()
        f.close()
        print(data)
    else:
        print("文件不存在")
    
  • 创建文件夹

    import os
    
    path = os.path.join('db', '2021', '11月份')
    print(path)  # db/2021/11月份
    
    os.makedirs(path)
    
    
    import os
    
    #  path = "db/2021/11月份"
    path = os.path.join('db', '2021', '11月份')
    
    if not os.path.exists(path):
        # 创建目录
        os.makedirs(path)
    
  • 删除文件、文件夹

    import os
    
    path = os.path.join('db', '2021', '11月份', 'log.txt')
    
    # 删除文件
    os.remove(path)
    
    import os
    import shutil
    
    path = os.path.join('db', '2021')
    
    # 删除文件夹,删除的是2021,db还在
    shutil.rmtree(path)
    
  • 判断是否是文件夹

    import os
    
    path = os.path.join('db', 'a1.txt')
    res = os.path.isdir(path)
    print(res)
    
  • os.listdir/os.walk

    import os
    
    # 查看某个目录下的所有的文件和文件夹(一级目录)
    for item in os.listdir("/Users/wupeiqi/Documents/视频教程/路飞Python/mp4/开篇"):
        print(item)
        
    """
    03 开篇:学习方法的建议.mp4
    课堂笔记
    05 开篇:写在最后.mp4
    04 开篇:笔记和文档的编写.mp4
    """
    
    import os
    
    # 查看某个目录下的所有的文件和文件夹,返回元组,元组中的内容分别为:搜索路径,文件夹名称列表,文件名称列表
    for in_path, folder_list, name_list in os.walk("/Users/wupeiqi/Documents/视频教程/路飞Python/mp4/开篇"):
        for name in name_list: #name_list为[],则下面语句不执行
            abs_path = os.path.join(in_path, name)
            print(abs_path) #输出所有文件的绝对路径
    

案例:找目录下的某个文件

案例:找到某个目录下的所有 含有某个关键字 的文件(文件路径)

import os

target_folder_path = "/Users/wupeiqi/Documents/视频教程/路飞Python/mp4"
key = "练习"

# 查看某个目录下的所有的文件和文件夹
for in_path, folder_list, name_list in os.walk(target_folder_path):
    for name in name_list:
        if key in name:
            abs_path = os.path.join(in_path, name)
            print(abs_path)

案例:

"""
用户注册:
    - 用户信息需要存储在 db/users/account.txt
"""
import os

while True:
    user = input(">>>")
    line = "{}\n".format(user)

    # 确保文件所在目录已存在 db/users(不存在,就创建)
    folder_path = os.path.join("db", "files")
    if not os.path.exists(folder_path):
        os.makedirs(folder_path)

    # 所在文件夹必须已存在
    file_path = os.path.join(folder_path, 'account.txt')
    file_object = open(file_path, mode='a', encoding='utf-8')
    file_object.write(line)
    file_object.close()

案例:景区订票系统

  • 新创建一个项目

  • 创建一个app.py的文件,这个文件实现所有的代码

  • 通过函数编程来实现

  • 业务需求

    • 启动项目时,监测当前项目目录下是否有 db 文件夹,如果没有就创建
    • 输入姓名,进入系统,监测:db/用户名.txt 文件是否存在
      • 老用户,存在
      • 新用户,不存在
    • 登录后选择功能:
      • 历史订单,打开文件并逐行读取内容。如果文件夹不存在,则输出无历史记录
      • 预定,输入:景区、数量、订票时间
import os
import datetime	

# DB_FOLDER = os.path.join("db", 'files')
DB_FOLDER = "db"


def history(user_file_path):
    """ 历史记录 """
    # 1.监测文件是否存在?不存在,输出:无历史记录
    if not os.path.exists(user_file_path):
        print("无历史记录")
        return

    # 2.读取文件的内容逐行打印(历史订票信息)
    print("=====历史记录=====")
    with open(user_file_path, mode='r', encoding='utf-8') as f:
        for line in f:
            line = line.strip()
            print(line)


def booking(user_file_path):
    """ 预定 """

    location = input("请输入景区名称:")
    count = input("订票数量:")
    ctime_string = datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S")

    line = "{},{},{}\n".format(location, count, ctime_string)

    with open(user_file_path, mode='a', encoding='utf-8') as file_object:
        file_object.write(line)


def run():
    # 1.检查文件夹是否存在
    if not os.path.exists(DB_FOLDER):
        os.makedirs(DB_FOLDER)

    # 2.输入用户名,监测是老用户还是新用户
    name = input("请输入姓名:")
    # db/用户名.txt
    file_path = os.path.join(DB_FOLDER, "{}.txt".format(name))
    if os.path.exists(file_path):
        print("欢迎再次回来,老用户")
    else:
        print("欢迎首次使用,新用户")

    # 3.功能的选择
    func_dict = {"1": history, "2": booking}
    while True:
        print("1.查询历史订单;2.预定")
        choice = input("请选择(q/Q):")
        if choice.upper() == 'Q':
            return
        func = func_dict.get(choice)
        if not func:
            print("序号输入错误,重新输入")
            continue
        func(file_path)


run()

2.7 shutil

  • 删除文件夹

    import shutil
    
    shutil.rmtree("xx/xxx/xxx/xxx")
    
  • 拷贝文件夹

    #拷贝文件夹
    shutil.copytree("原文件夹","目标文件夹路径")
    
    # 拷贝源文件到文件夹(保证文件夹已存在)
    shutil.copy("原文件","目标文件夹路径/") # /可不加,加/表示是添加文件到文件夹
    
  • 重命名

    import shutil
    
    # 文件重命名
    shutil.move("x10.txt", 'x11.txt')
    
    # 文件夹重命名
    shutil.move("x1", 'x100')
    
    
  • 压缩和解压缩

    import shutil
    
    # base_name,压缩包的文件名
    # format,后缀名
    # root_dir,压缩的文件夹路径
    shutil.make_archive(base_name='1116', format='zip', root_dir="ppp")
    
    
    # filename,压缩包的文件名
    # extract_dir,要解压的目录
    # format,后缀名
    shutil.unpack_archive(filename="1116.zip", extract_dir="1117", format='zip')
    

练习题:

day01 
	01 fullstack s7 day01 xxxxxx.mp4
	02 fullstack s7 day01 xxxxxx.mp4
	03 fullstack s7 day01 xxxxxx.mp4
	04 fullstack s7 day01 xxxxxx.mp4
	xxxx.md

寻找day01目录下的所有mp4为后缀的文件,给重命名:

01 fullstack s7 day01 xxxxxx.mp4    ->  01 xxxxxx.mp4
import os
import shutil

folder_path = "/Users/wupeiqi/PycharmProjects/gx_day08/day01"

for name in os.listdir(folder_path):
    ext = name.rsplit(".", maxsplit=1)[-1]
    if ext != "mp4":
        continue

    new_name = name.replace("fullstack s7 day01 ", "")

    old_file_path = os.path.join(folder_path, name)
    new_file_path = os.path.join(folder_path, new_name)
    # 重命名
    shutil.move(old_file_path, new_file_path)
#补充rsplit
name = "aaa.ddd.ttt"
res = name.rsplit(".", maxsplit=1)
print(res) #['aaa.ddd', 'ttt']

2.8 re

  • 正则表达式【与语言无关】
  • Python中的re模块

正则表达式是干啥的?

text = "楼主太牛了,在线 [email protected][email protected]谢谢楼主,手机号也可15131255789,起来呀"

需求:将字符串中的手机号提取出来
	手机号特征:1[3|5|8|9]\d{9}     -> 正则语法规定

2.8.1.字符相关

  • 固定文本

    import re
    
    text = "你好wupeiqi,阿斯顿发wupeiqasd 阿士大夫能接受的wupeiqiff"
    
    data_list = re.findall("wupeiqi", text)
    
    print(data_list) # ["wupeiqi", "wupeiqi"]
    
  • 匹配字符

    import re
    
    text = "你2b好wupeiqi,阿斯顿发awupeiqasd 阿士大夫a能接受的wffbbupqaceiqiff"
    data_list = re.findall("[abc]", text)
    print(data_list) # ['b', 'a', 'a', 'a', 'b', 'b', 'c']
    
    import re
    
    text = "你2b好wupeiqi,阿斯顿发awupeiqasd 阿士大夫a能接受的wffbbupqcceiqiff"
    data_list = re.findall("q[abc]", text)
    print(data_list) # ['qa', 'qc']
    
  • 字符范围 a-z 0-9

    import re
    
    text = "alexrootrootadmin"
    data_list = re.findall("t[a-z]", text)
    print(data_list)  # ['tr', 'ta']
    
    import re
    
    text = "alexrootrootadmin"
    data_list = re.findall("t[0-9]", text)
    print(data_list)  # []
    
  • \d代表1个数字

    import re
    
    text = "root-ad32min-add3-admd1in"
    data_list = re.findall("d\d", text)
    print(data_list) # ['d3', 'd3', 'd1']
    
    import re
    
    text = "root-ad32min-add33322-admd1in"
    data_list = re.findall("d\d+", text)  # +,1个或n个
    print(data_list) # ['d32', 'd33322', 'd1']
    
    import re
    
    text = "rodot-ad32min-add33322-admd1in"
    data_list = re.findall("d\d*", text)  # *,0个或n个
    print(data_list) # ['d', 'd32', 'd', 'd33322', 'd', 'd1']
    
    import re
    
    text = "rodot-ad32min-add33322-admd1in"
    data_list = re.findall("d\d?", text)  # ?,0个或1个
    print(data_list) # ['d', 'd3', 'd', 'd3', 'd', 'd1']
    
    import re
    
    text = "rodot-ad32min-add33322-admd1in"
    data_list = re.findall("d\d{2}", text)  # {n},固定n个
    print(data_list) # ["d32","d33"]
    
    import re
    
    text = "rodot-ad32min-add33322-admd1in"
    data_list = re.findall("d\d{2,}", text)  # {n,},固定n+个
    print(data_list) # ['d32', 'd33322']
    
    import re
    
    text = "rodot-ad32min-add33322-admd1in"
    data_list = re.findall("d\d{2,4}", text)  # {n,m},固定 n<=个数 <=m
    print(data_list) # ['d32', 'd3332']
    
  • \w 字母、数字、下划线(汉字)

    import re
    
    text = "北京武沛alex齐北  京武沛alex齐"
    
    data_list = re.findall("武\w+x", text)
    print(data_list) # ['武沛alex', '武沛alex']
    
    import re
    
    text = "北京武沛alex齐北京武沛alex齐"
    
    data_list = re.findall("武\w+x", text)  # 贪婪匹配(默认)(尽可能多的去匹配)
    # print(data_list)  # ['武沛alex齐北京武沛alex']
    
    
    data_list = re.findall("武\w+?x", text)  # 非贪婪匹配(找到第一个匹配,就不要再继续了)
    print(data_list)  # ['武沛alex', '武沛alex']
    

    问题:正则默认是贪婪匹配,如何改成非贪婪匹配:在正则中添加一个 ?

  • . 除换行符以外的任意字符

    import re
    
    text = "alexraotrootadmin"
    data_list = re.findall("r.o", text)
    print(data_list) # ['rao', 'roo']
    
    import re
    
    text = "alexraotrootadmin"
    data_list = re.findall("r.+o", text) # 贪婪匹配
    print(data_list)  # ['raotroo']
    
    import re
    
    text = "alexraotrootadmin"
    data_list = re.findall("r.+?o", text) # 贪婪匹配
    print(data_list)  # ['rao', 'roo']
    
  • \s代表任意一个空白符

    import re
    
    text = "root admin fdd dmin"
    data_list = re.findall("a\w+\s\w+", text)
    print(data_list)  # ['admin fdd']
    

2.8.2.数量

  • *,0或n
  • +,1或n
  • ?,0或1
  • {n},固定n个
  • {n,},n+个
  • {n,m},n~m个

注意:默认贪婪匹配,非贪婪匹配 数量+?

2.8.3.分组

  • 提取数据区域

    import re
    
    text = "楼主太牛逼了,在线想要 [email protected][email protected]谢谢楼主,手机号也可15131255799,搞起15131255789来呀"
    data_list = re.findall("151312\d{5}", text)
    print(data_list)  # ['15131255799', '15131255789']
    
    import re
    
    text = "楼主太牛逼了,在线想要 [email protected][email protected]谢谢楼主,手机号也可15131255799,搞起15131255789来呀"
    data_list = re.findall("15131(2\d{5})", text)
    print(data_list)  # 会按去掉空格后的字符进行匹配,但只返回括号内的内容['255799', '255789']
    
    import re
    
    text = "楼主太牛逼了,在线想要 [email protected][email protected]谢谢楼主,手机号也可15131255799,搞起15131255789来呀"
    data_list = re.findall("(1\d{2})31(2\d{5})", text)
    print(data_list)  # [('151', '255799'), ('151', '255789')]
    
  • 提取数据区域 + 或

    import re
    
    text = "楼主15131root太牛15131alex逼了,在线想要 [email protected][email protected]谢谢楼主,手机号也可15131255789,搞起来呀"
    
    # 15131(2\d{5})
    # 15131(r\w+太)
    data_list = re.findall("15131(2\d{5}|r\w+太)", text)
    print(data_list)  # ['root太', '255789']
    
练习题
  1. 正则QQ号

    [1-9]\d{4,}
    
    [1-9]\d{4,12}
    
  2. 身份证号码

    130449199912038879
    13044919991203887X
    
    \d{17}[\dX]
    
    import re
    
    text = "我的身份证130449197912038879,郭智的身份之是13044919991203887X阿斯顿发士大夫"
    
    res = re.findall('\d{17}[\dX]', text)
    print(res)
    
    import re
    
    text = "我的身份证130449197912038879,郭智的身份之是13044919991203887X阿斯顿发士大夫"
    
    # res = re.findall('\d{17}[\dX]', text)
    res = re.findall('\d{6}(\d{4})\d{7}[\dX]', text)
    print(res)
    
    import re
    
    text = "我的身份证130449197912038879,郭智的身份之是13044919991203887X阿斯顿发士大夫"
    
    # res = re.findall('\d{17}[\dX]', text)
    res = re.findall('(\d{6}(\d{4})\d{7}[\dX])', text)
    print(res) #[('130449197912038879', '1979'), ('13044919991203887X', '1999')]
    
  3. 手机号

    1[3-9]\d{9}
    
  4. 邮箱地址

    [email protected]
    
    \w+@\w+.    此时 . 代表的任意字符串
    
    \w+@\w+\.\w+   此时 . 就是代表 .
    
    import re
    
    text = "楼主太牛逼了,在线想要 [email protected][email protected]谢谢楼主,手机号也可15131255789,搞起来呀"
    
    email_list = re.findall("\w+@\w+\.\w+", text)
    print(email_list)  # ['[email protected]和xxxxx']
    
    import re
    
    text = "楼主太牛逼了,在线想要 [email protected][email protected]谢谢楼主,手机号也可15131255789,搞起来呀"
    # 添加re.ASCII后,\w就不包含中文
    email_list = re.findall("\w+@\w+\.\w+", text, re.ASCII)
    print(email_list)  # ['[email protected]', '[email protected]']
    
    import re
    
    text = "楼主太牛逼了,在线想要 [email protected][email protected]谢谢楼主,手机号也可15131255789,搞起来呀"
    email_list = re.findall("[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+\.[a-zA-Z0-9_-]+", text)
    print(email_list)  # ['[email protected]', '[email protected]']
    

2.8.4. re模块

  • re.findall,获取匹配成功的所有结果

  • re.match,从开始进行匹配,开头没匹配成功就不再继续向后看;返回第一个对象

    import re
    
    text = "水电费逗2B最逗3B欢乐"
    
    v1 = re.findall("逗\dB", text)
    print(v1)  # ['逗2B', '逗3B']
    
    v2 = re.match("逗\dB", text)
    print(v2)  # None    
    
    #如果匹配到,返回<re.Match object; span=(0, 3), match='逗2B'>
    if v2:
        content = v2.group()
        print(content)
    
    # 对用户输入的数据进行格式的校验
    import re
    
    mobile = input("请输入手机号:")
    mobile = mobile.strip()
    
    # 1.校验手机号是否正确
    result = re.match("^1[3-9]\d{9}$", mobile)  # 限制字符串只能与正则一模一样
    if result:
        print("格式正确")
    else:
        print("格式错误")
    
  • re.search,浏览器正则字符串去匹配,返回第一个对象

    import re
    
    text = "水电费逗2B最逗3B欢乐"
    
    v2 = re.search("逗\dB", text)
    if v2:
        data = v2.group()
        print(data) #'逗2B'
    
  • split

    text = "adafsdafasdfa.mp4"
    text.split(".")
    
    import re
    
    text = "逗2B最逗3B欢乐"
    
    data_list = re.split("\dB",text)
    print(data_list) # ['逗', '最逗', '欢乐']
    
    import re
    
    text = "1+2-8+10-9"
    
    data_list = re.split("[+-]", text)
    print(data_list)  # ['1', '2', '8', '10', '9']
    

小结

以上就是常见内置模块大家需要了解的内容

标签:自定义,day07,list,text,模块,path,print,import,data
From: https://www.cnblogs.com/vahan/p/16921626.html

相关文章

  • 光模块的参数有哪些呢?
    在现代信息网络汇总,光纤通信占据着主导地位,随着网络的覆盖越来越广泛和通信容量的不断增加,通信链路的提升也是必然的发展,光模块在光通信网络中实现着光电信号的转换,是光纤通......
  • c#自定义控件模板代码
    usingSystem;usingSystem.Collections.Generic;usingSystem.ComponentModel;usingSystem.Drawing;usingSystem.Data;usingSystem.Linq;usingSystem.Text;usingSyste......
  • VUE3 自定义 轻量级全局数据共享方案之一 Provide&inject (简单快速实现vuex功能)
    在vue2中,提供了provide和inject配置,可以让开发者在高层组件中注入数据,然后在后代组件中使用除了兼容vue2的配置式注入,vue3在compositionapi中添加了provide和inject方法......
  • Ajax第三方模块
    Axios下载cnpminstallaxiosAxios的常用方法index.html<!DOCTYPEhtml><htmllang="en"><head><metacharset="UTF-8"><metahttp-equiv="X-UA-Compat......
  • 自定义View
    View类是Android中各种组件的基类,如View是ViewGroup基类,表现为显示在屏幕上的各种视图。Android中的UI组件都是由View和ViewGroup组成。 ttributeSet与自定义属性:系统自......
  • 自定义的Qt搜索框控件
    该控件模仿的是比较常见的应用程序中的搜索框。实现了输入文本后按回车搜索(也可以点击搜索按钮开始搜索),和记住最近的几个搜索记录的功能。使用者通过响应inputCompleted信......
  • Vue笔记 - 自定义事件与事件总线
    自定义事件与事件总线目录自定义事件与事件总线1.事件1.1基本使用1.2事件修饰符1.3键盘事件2.自定义事件3.全局事件总线1.事件1.1基本使用使用v-on:xxx或......
  • SAP-SD-ABAP-VMOD 查找和应用SD模块用户出口(user exit) 好方法
    针对SD模块,有一个专门管理user-exit的开发包 VMOD,只要用tcode:se80查看它,会发现绝大部分的SD要相关的user-exit都能在这找到。......
  • 手动创建线程池+自定义拒绝策略
    try{ThreadFactorytycThreadFactory=newThreadFactoryBuilder().setNamePrefix("tyc-call-inf").build();//拒绝策略,超过线程数+......
  • Nginx 的 SSL 模块安装
    1、查看nginx是否安装http_ssl_module模块nginx-V  如果出现configurearguments:–with-http_ssl_module,则已安装=======未安装则安装https模块===========......