jieba.lcut()用于对中文分词, split是对字符串操作,使字符变为列表分割
import jieba text = "欢迎来到通大" seg_list = jieba.cut(text, cut_all=False) print("精确模式: " + "/ ".join(seg_list))
精确模式: 欢迎/ 来到/ 通大
jieba.posseg()进行词性标注
import jieba.posseg as pseg words = pseg.cut("我喜欢小狗") for word, flag in words: print('%s/%s' % (word, flag))
我/r
喜欢/v
小狗/nr
jieba.analyse()进行关键词提取
from jieba import analyse text = "夏天适合吃西瓜" keywords = analyse.extract_tags(text, topK=3) print(keywords) ['西瓜', '夏天', '适合']
format格式化输出
:引导符号
<填充>用于填充的单个字符
<对齐> <左对齐
>右对齐
^居中对齐
<宽度>槽的设定,输出宽度
<,>数字的千位分隔符适用于整点数与浮点数
<.精度>浮点数小数部分的精度或字符串的最大输出长度
<类型>整数类型b,c,d,o,x,X 浮点数类型e,E,f,%
chr()
用于将指定的整数(即 Unicode 码点)转换为其对应的字符,与 chr()
函数相对的是 ord()
函数,它接受一个长度为 1 的字符串作为参数,并返回该字符串的 Unicode 码点.
eval
其主要功能是对字符串形式的表达式进行求值
补充:若ls=f.readlines()无法运行,报错readlines没有被定义。 解决方法:f=open('sensor.txt', 'r',encording=utf-8) 或者后面加errors='ignore'
[::-1] 首尾位置,及顺序或者逆序
在最终输出的结果上,若不想分行,即 print(i,end=")
random库 seed(a = None) 初始化随机种子,默认值为当前系统时间
random() 生成一个[0.0,1.0]之间的随机小数
randint(a,b) 生成一个a,b之间的整数
sample(pop,k)从pop类型中随机选取k个元素,一列表形式返回
编写n的平方 pow(n,2)
list(x) 将x转变成列表类型
Ls.append(x) 在列表ls最后增加一个元素x
Ls.insert(i,x) 在列表Ls第i位置增加元素x
a和b是两个列表变量,列表a为[3.6.9]已给定,键盘输入列表b,将a列表的三个元素插入到b列表中对应的前三个元素的后面。并显示输出在屏幕上。例如:键盘输入列表b为[1,2,3],因此,屏幕输出计算结果为[1,3,2,6,3,9]
a = [3, 6, 9] b = eval(input())#例如:[1,2,3] j=1 for i in range(len(a)) b.insert(j, a[i]) j+=2 print (b)
键盘输入正整数n,按要求把n输出到屏幕,格式要求:宽度为25个字符,等号字符(=)填充,右对齐,带千位分隔符。如果输入正整数超过25位,则按照真实长度输出
例如:键盘输入正整数n为1234,屏幕输出====================1,234
s = input() print("{}".format(eval(s)))
input 输入的是字符串,format不能直接填s,需要eval函数
标签:输出,jieba,python,text,列表,学习,字符串,print From: https://www.cnblogs.com/candice1/p/18395084