首页 > 其他分享 >字符串划分方法汇总

字符串划分方法汇总

时间:2024-10-28 13:32:28浏览次数:5  
标签:apple text 汇总 orange 划分 result 分隔符 字符串 banana

  1. 基本的 split() 方法
  • split() 按照指定分隔符将字符串分割成一个列表。如果不指定分隔符,默认使用空格。
text = "apple banana orange"
result = text.split()  # 默认按空格分割,结果:['apple', 'banana', 'orange']
​
text = "apple,banana,orange"
result = text.split(",")  # 按逗号分割,结果:['apple', 'banana', 'orange']
  1. partition() 和 rpartition() 方法
  • partition() 将字符串按照第一个匹配的分隔符分成三部分:分隔符前、分隔符本身、分隔符后。

  • rpartition() 从右边开始查找第一个匹配的分隔符。

text = "apple-banana-orange"
result = text.partition("-")  # ('apple', '-', 'banana-orange')
​
result = text.rpartition("-")  # ('apple-banana', '-', 'orange')
  1. 多分隔符分割:re.split()
  • 使用 re.split() 可以按多个分隔符分割字符串。
import re
text = "apple; banana, orange"
result = re.split(r"[;, ]+", text)  # ['apple', 'banana', 'orange']
  1. 按固定长度分割字符串
    可以使用列表解析等方式,按固定长度划分字符串。
text = "abcdefgh"
n = 2
result = [text[i:i+n] for i in range(0, len(text), n)]  # ['ab', 'cd', 'ef', 'gh']
  1. 使用 csv 模块处理复杂分隔符(如逗号、引号等)
    如果字符串中包含逗号或特殊格式,可以用 csv 模块处理。
mport csv
text = 'apple,"banana, mango",orange'
reader = csv.reader([text])
result = next(reader)  # ['apple', 'banana, mango', 'orange']
  1. 自然语言处理的分词(Tokenizer)
    使用 nltk、spaCy 等库可以将文本分割成词语或句子。
from nltk.tokenize import word_tokenize
text = "This is a sample sentence."
result = word_tokenize(text)  # ['This', 'is', 'a', 'sample', 'sentence', '.']
  1. textwrap 模块按宽度分割
    textwrap 模块可将字符串按指定宽度拆分成多行。
import textwrap
text = "This is a long string that needs to be wrapped."
result = textwrap.wrap(text, width=10)
# ['This is a', 'long string', 'that needs', 'to be', 'wrapped.']

标签:apple,text,汇总,orange,划分,result,分隔符,字符串,banana
From: https://www.cnblogs.com/pmna/p/18510359

相关文章

  • 一文带你搞懂Java字符串
    1.API1.1API概述什么是API?API(ApplicationProgrammingInterface)是应用程序编程接口,它是一组工具、类、方法和规则,使不同的应用程序可以通过接口进行数据交互和操作。API的作用主要是:封装复杂性:提供简单的接口供开发者调用,不需要关心底层实现的细节。提高复用......
  • 字符串谁更快?String vs StringBuilder大比拼
    在Java中处理字符串,String和StringBuilder都是常用的类,它们的区别有点像在厨房里选择不同的工具:String就像是一把只能用一次的纸杯,改一次就得换新的;而StringBuilder就像一只可以反复使用的水杯,随时可以修改。这两个类各有优缺点,咱们一起来看看它们的区别和用法吧。String......
  • 28个漏洞测试靶场 黑客学习资源汇总
    28个渗透测试靶场黑客学习资源汇总28个渗透测试靶场OWASPBrokenWebApps分享渗透测试演练环境,里面继承了57个数据库的渗透测试环境。包括aspx,asp,php,jsp等等各种演练环境。http://pan.baidu.com/s/1o7VQPZk密码:09qz常见靶场DVWA(DamVulnerableWebApplication)DVW......
  • 格式化字符串漏洞沉浸式理解
    格式化字符串漏洞总结利用的是2024shctf中的fmt_fmt开启pie放到ida中看看反汇编mian函数无条件循环,根据输入的值不同调用不同的函数show_flag函数这个函数会将dest中的内容打印出来,这里就有格式化字符串漏洞,如果能够修改ptr指针的话就能控制dest的内容,那这样就可以......
  • 嵌入式软件名企笔试真题文章汇总帖
    1、前言欢迎各位来到我的专栏,笔者为25届应届毕业生,投递岗位为嵌入式软件开发工程师相关岗位,在秋招过程中有意记录各大企业的真实笔试题目,现以博客形式记录,有意者可自行查看!2、约定笔者专栏中的每篇文章将采用统一的习惯/步骤,以方便读者查找,主要有以下几点需要注意:专栏中的......
  • 软硬件开发面试问题大汇总篇——针对非常规八股问题的提问与应答(代码规范与生态管理)
    软硬件开发,对于编码规范、生态管理等等综合问题的考察尤为重要。阐述下环形缓冲区的用途 环形缓冲区(RingBuffer)是一种固定大小的数据结构,常用于实现数据的流式传输或临时存储。在环形缓冲区中,当到达缓冲区的末尾时,它会回绕到开始部分,从而形成一个“环”。用途总结数......
  • 算法汇总整理篇——回溯与图论的千丝万缕及问题的抽象思考
    回溯算法(重中之重)回溯法解决的问题都可以抽象为树形结构,集合的大小就构成了树的广度,递归的深度就构成了树的深度。(回溯的核心:分清楚什么数据作为广度,什么数据作为深度!!!!!)voidbacktracking(参数){if(终止条件){存放结果;return;}for......
  • 【Unity开发】如何使用 Assembly Definition 划分多个程序集,减少编译时间
    在Unity开发中,项目的复杂性和规模不断增加,这导致编译时间变得越来越长。为了提升编译效率,使用AssemblyDefinition文件(.asmdef)将代码划分成多个程序集是一种非常有效的解决方案。1.什么是AssemblyDefinition?AssemblyDefinition是一种Unity用于定义C#程序集的文件。通过将代......
  • 12. 汇总数据
    聚集函数用来汇总数据。MySQL支持一系列聚集函数,可以用多种方法使用它们以返回所需的结果。这些函数是高效设计的,它们返回结果一般比你在自己的客户机应用程序中计算要快得多。1.聚集函数我们经常需要汇总数据而不用把它们实际检索出来,为此MySQL提供了专门的函数。使用这些函数......
  • 算法汇总
    排序算法计数排序voidcountsort(int*a,intn)//计数排序{for(inti=1;i<=n;i++){cnt[a[i]]++;}for(intj=1;j<=Max;j++){for(intk=0;k<cnt[j];k++)cout<<j<<""......