首页 > 其他分享 >pandas筛选出某列中含有特定文本内容的所在行

pandas筛选出某列中含有特定文本内容的所在行

时间:2023-04-26 10:44:31浏览次数:42  
标签:loc 某列 df text some column 文本 pandas name

1、所在行内容是单一的或者是标量

df_fintech = df_text[df_text['业务一级分类']=="金融科技"]

  

2、所在行内容是割裂的

先转成str格式再用contains筛选

df_fintech = df_text[df_text['业务一级分类'].str.contains("金融科技")]

  

3、筛选出列值属于某个范围内的行,用isin

df.loc[df['column_name'].isin(some_values)]  # some_values是可迭代对象

  

4、多种条件限制时使用&,&的优先级高于>=或<=,所以要注意括号的使用

df.loc[(df['column_name'] >= A) & (df['column_name'] <= B)]

  

5、筛选出列值不等于某个/些值的行

利用反选的思想:

df.loc[df['column_name'] != 'some_value']
df.loc[~df['column_name'].isin('some_values')] #~取反 if values are str, remember to pass a list ['str1','str2']

  

 

 

参考:https://blog.csdn.net/weixin_43557139/article/details/109459352

标签:loc,某列,df,text,some,column,文本,pandas,name
From: https://www.cnblogs.com/pu369/p/17354958.html

相关文章

  • Java模拟实现一个基于文本界面的《记账软件》
    /**@author:Noiimplant*@version:1.0*/1.利用java实现简易记账软件根据尚硅谷java教程进行练习2.实现功能记录家庭支出、收入,打印收支明细表使用分级菜单的方式3.代码实现3.1GuliAccount.javapackageGuliAccount;importjava.text.SimpleDateFormat;import......
  • 快速上手Linux核心命令(五):文本处理三剑客
    @目录前言正则表达式第一剑客grep第二剑客sed第三剑客awk小结剑仙镇楼~O(∩_∩)O前言上一篇中已经预告,我们这篇主要说Linux文本处理三剑客。他们分别是grep、sed、awk。既然能被业界称为三剑客,可见其在Linux命令中占有举足轻重得地位。所以呢,这里也专门写一篇文章说一说......
  • hive数据从文本导入
    1,建表语句(idint,namestring,ageint,telstring)ROWFORMATDELIMITEDFIELDSTERMINATEDBY'\t'STOREDASTEXTFILE;2,url.txt文本1 wyp25131888888888882test30138888888888883zs348993141213,加载......
  • pandas中的agg和rolling和asfreq
    importpandasaspddf=pd.DataFrame({"col1":list(range(10)),"col2":list(range(1,11)),"col3":"2"*10})print(df.shape)print(df)#找出df中每列的最小值、最大值,生成新DataFrameprint(df.agg(['min','max'......
  • LLM(大语言模型)解码时是怎么生成文本的?
    Part1配置及参数transformers==4.28.1源码地址:transformers/configuration_utils.pyatv4.28.1·huggingface/transformers(github.com)文档地址:Generation(huggingface.co)对于生成任务而言:text-decoder,text-to-text,speech-to-text,andvision-to-textmodels,有以......
  • Python pandas读取csv文件时数字变成科学计数法(含有e)
    字段内容比较长时,Python读取会变成变成科学计数法(含有e)像这样importpandasaspsdata=ps.read_csv(r"E:\AppData\DongDong\Download\file\2023-04\BaseDataPriceDetail.csv",sep=',',usecols=[4])arrary=data.values[0::,0::]#读取全部行,全部列print(arrary[19])输出......
  • pandas.DataFrame—构建二维、尺寸可变的表格数据结构
    语法格式pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=None)常用的几个参数解释:data:一系列数据,包括多种类型;index:索引值,行标签,默认值为RangeIndex(0,1,2,…,n);columns:列标签,默认值为RangeIndex(0,1,2,…,n);dtype:设置数据......
  • pandas.DataFrame.groupby—使用映射器或通过一系列列对数据框进行分组
    语法格式DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=_NoDefault.no_default, squeeze=_NoDefault.no_default, observed=False, dropna=True)常用的几个参数解释:by:可接受映射、函数、标签或标签列表。用于确定分组。ax......
  • 如何生成文本: 通过 Transformers 用不同的解码方法生成文本
    简介近年来,随着以OpenAIGPT2模型为代表的基于数百万网页数据训练的大型Transformer语言模型的兴起,开放域语言生成领域吸引了越来越多的关注。开放域中的条件语言生成效果令人印象深刻,典型的例子有:GPT2在独角兽话题上的精彩续写,XLNet以及使用CTRL模型生成受控文本等......
  • SQL: PL/SQL打印用户表脚本文本
    PLSQL打印用户表脚本文本环境:ORACLE19C createorreplacepackageCUX_util_pkg2is--Author:SAM--Created:2022/8/2110:20:39--Purpose:LONG_TO_CHAR--更新:2023/4/24,增加识别临时表----将ORACLELONG类型转为字符串类型FUNCTIONLON......