首页 > 编程语言 >Python爬虫学习

Python爬虫学习

时间:2024-04-12 09:12:36浏览次数:28  
标签:name Python s1 爬虫 学习 person print True age

基础语法

  1. 字符串单引号双引号都行,是为了打印出引号才设计出两种的
s1 = '"haha"'
s2 = "'haha'"
print(s1)
print(s2)
# 结果是: "haha" 'haha'
  • 事实上就近匹配,比如 s = ''haha'' 会被解析成前面俩一对 后面俩一对
s = '''haha'''
print(s)
# 结果仍然是 haha
  1. 元组() 列表【】 并且元组只读,列表可改

  2. 字典 a = {"name" : "jack", "age" : 18}

  3. type(xxx) 查看类型!!

  4. 类型转换

int("123")    # 123

int(-3.14)    # -3

int(True)     # 1

int([5])      # 5

int([1,2,3])  # 报错

int("3.14")   # 报错

float(3)      # 3.0

float("3.14") # 3.14

float(True)   # 1.0

# 任意数据类型都可以无损转字符串,包括True False、列表元组字典

str(xxx)

# 非零 非空的转bool 都是True 否则是false

bool([0])     # True

bool("0")     # True

bool(" ")     # True

bool(print(1))# False
  1. 运算符
  • 加减乘除余 + - * / %

字符串乘法也可以用!!!

  • 整数除 // (python里: 3/2=1.5 3//2=1)
  • ** 求指数,相当于^
  • 赋值运算符,可以a=b=10 还可以a,b = 10, 10
  • 与或非 and or not
    True and print("YES") 打印,因为前面真还要判断后面!
    False and print("YES") 不打印,因为前面是假直接返回了!
    True or print("YES") 不打印,因为前面是True 直接返回了!
    False or print("YES") 打印,因为前面是假还要判断后面!
  1. 输入输出
  • 格式化输出,类似于sprintf
age = 18
name = "Jack"
print("我的名字是%s,我的年龄是%d" % (name,age))
  • 输入age = input("请输入") 返回age是一个str!!!
  1. 循环控制
  • range(5) 相当于 [0,1,2,3,4],但他是个可迭代对象,需要用list(range(5))转换为列表
  • range(1,5) 相当于[1,2,3,4] 左闭右开!!!!
  • range(1,10,3) 相当于[1,4,7]

高级语法

字符串

s1 = "China"
print(len(a))              # 5
print(s1.find('a'))        # 4 , 第一次出现的位置,如果没出现过就返回-1
print(s1.startswith('C'))  # True
print(s1.endswith('b'))    # False
print(s1.count('h'))       # 1 ,出现了一次
print(s1.replace('C','c')) # china
s2 = "1#2#3#4"
print(s2.split('#'))       # [1,2,3,4]
print(s1.upper())          # CHINA
print(s1.lower())          # china
s3 = "1 2 3"
print(s3.strip())          # 123, 且更改len

列表

a = [1,"2",True]
a.append(False)
a.insert(2, "3")                # 3 的索引就是 2

b = ["j", "k"]
a.extend(b)                     # 相当于append,不过是逐一追加一个列表

if 1 in a:
    print("在")


a.pop()                         # 返回最后一个元素,a的最后一个元素被删除,可print(a)
a.remove(1)                     # 返回None, 删除元素值为1的元素
del a[2]                        # 删除下标2的元素,不可被赋值为表达式!

元组

  • 和列表不同之处在于,不可修改元素
  • a = (1,) type才是tuple,如果不加逗号,就看做int

切片

适用于字符串 列表 元组

s = "abcdefg"
print(s[0:4])       # abc, 从0到4左闭右开
print(s[1:])        # bcdefg
print(s[:4])        # abc
print(s[0:6:2])     # ace

字典

person = {"name" : "吴谦", "age" : 28}
print(person["name"])
print(person.get("name"))

del person["age"]
print(person)

del person                            # print会报错,因为没有这个对象了
person.clear()                        # 保留对象,print显示{}

# 遍历方法:keys() values() items()
for key in person.keys():
    print(keys)

.....

for i in person.items():
    print(i)                          # 得到的结果是("name":"吴谦")  ("age":28)

for i,j in person.items():
    print(i,j)

标签:name,Python,s1,爬虫,学习,person,print,True,age
From: https://www.cnblogs.com/xsl-blogs/p/18124407

相关文章

  • 20个Python 正则表达式应用与技巧
    本文分享自华为云社区《Python正则表达式大揭秘应用与技巧全解析》,作者:柠檬味拥抱。Python中的re模块是用于处理正则表达式的强大工具。正则表达式是一种用来匹配字符串的模式,它可以在文本中搜索和匹配特定的字符串模式。在本文中,我们将探讨Python中re模块的应用和一些技......
  • Elastic学习之旅 (9) 结构化搜索
    大家好,我是Edison。上一篇:基于Term和全文的ES查询结构化数据结构化搜索(StructuredSearch)是指对结构化数据的搜索,那么,什么数据是结构化的呢?ES中日期、布尔类型和数字都是结构化的。另外,文本也可以是结构化的:比如彩色笔可以有离散的颜色集合:红、蓝、绿等;一个博客也可能......
  • 卷积神经网络调参之学习率
    原文链接:https://blog.csdn.net/hzqgangtiexia/article/details/80509211学习率对于深度学习是一个重要的超参数,它控制着基于损失梯度调整神经网络权值的速度,大多数优化算法(SGD、RMSprop、Adam)对其都有所涉及。学习率越小,损失梯度下降的速度越慢,收敛的时间更长,如公式所示:new_wei......
  • Flink源码学习(4) TaskManager从节点启动分析
    taskManager是flink的worker节点,负责slot的资源管理和task执行一个taskManager就是一台服务器的抽象TaskManager基本资源单位是slot,一个作业的task会部署在一个TM的slot上运行,TM会负责维护本地的slot资源列表,并与Master和JobManager进行通信启动主类:TaskManagerRunnerTaskMan......
  • 狂神说Java Web学习笔记_Cookie
    会话用户打开一个浏览器,点击了很多链接,访问了很多web资源,关闭浏览器之后,这个过程可以称之为一次会话。有状态会话一个同学来过教室,大家看到了,下次再来教室的时候,我们会知道这个同学曾经来过,这个被称为有状态会话。一个网站如何证明你访问过?服务端给客户端一个信件,客户端下次......
  • [学习笔记] LCA - 图论
    [NOIP2013提高组]货车运输最大生成树+LCA+倍增好家伙,这道题我写了一个晚上,调了两个晚上,对于这道题我颇有感触。但这道题确实好,实实在在的蓝题,让我发现了许多关于LCA的问题。首先,这个题给的是一个无向图,并不是个树,为了减少运算量,我们可以把它变成一个树。运用Kruskal算法生......
  • 读论文-基于Python的协同过滤算法的研究与应用实现
    前言今天读的论文为一篇名为《基于Python的协同过滤算法的研究与应用实现》的论文,文章是在2019年9月发表于《电脑知识与技术》的一篇期刊论文。摘要随着科学技术的快速发展和知识产权的日益重要,大多数用户会选择在播放平台上看电影。例如腾讯视频、爱奇艺等,用户迫切需要一个合......
  • 读论文-基于自注意力机制和迁移学习的跨领域推荐算法
    前言今日要读的文章为一篇2022年4月2日发表于《计算机科学》的期刊文章;文章发现了传统的单领域推荐算法的问题:传统的单领域推荐算法受限于用户和项目的稀疏关系,存在用户/项目冷启动的问题,并且,其仅以用户对项目评分进行建模,忽略了评论文本中所蕴含的信息。基于此,文章提出了一种基......
  • 树链剖分 学习笔记
    随便写一点。1.原理定义重儿子为子树内子树大小最大的任一个点,重边为重儿子向其父亲连的边,其余为轻边。根据定义,轻边的父亲的子树大小一定不小于这个点的子树大小的二倍。又可以证出重边数量是\(O(\logn)\)的。因此可以用线段树维护这个东西。2.应用2.1dsu2.2lca考......
  • Python中利用enumerate()精简循环中的索引和元素访问
    ​ Python中,enumerate()函数是一个内置函数,用于在遍历序列(如列表、元组或字符串)时同时获取每个元素的索引和值。可以使代码更简洁、更易读,特别是在需要索引时。使用enumerate()可以避免使用传统的范围(range())和长度(len())组合来访问元素和它们的索引。参考文档:Python中......