pandas筛选出某列中含有特定文本内容的所在行

时间：2023-04-26 10:44:31浏览次数：46

标签：loc 某列 df text some column 文本 pandas name

1、所在行内容是单一的或者是标量

df_fintech = df_text[df_text['业务一级分类']=="金融科技"]

2、所在行内容是割裂的

先转成str格式再用contains筛选

df_fintech = df_text[df_text['业务一级分类'].str.contains("金融科技")]

3、筛选出列值属于某个范围内的行，用isin

df.loc[df['column_name'].isin(some_values)]  # some_values是可迭代对象

4、多种条件限制时使用&，&的优先级高于>=或<=，所以要注意括号的使用

df.loc[(df['column_name'] >= A) & (df['column_name'] <= B)]

5、筛选出列值不等于某个/些值的行

利用反选的思想：

df.loc[df['column_name'] != 'some_value']
df.loc[~df['column_name'].isin('some_values')] #~取反 if values are str, remember to pass a list ['str1','str2']

参考：https://blog.csdn.net/weixin_43557139/article/details/109459352

标签：loc,某列,df,text,some,column,文本,pandas,name
From： https://www.cnblogs.com/pu369/p/17354958.html

Java模拟实现一个基于文本界面的《记账软件》
/**@author:Noiimplant*@version:1.0*/1.利用java实现简易记账软件根据尚硅谷java教程进行练习2.实现功能记录家庭支出、收入，打印收支明细表使用分级菜单的方式3.代码实现3.1GuliAccount.javapackageGuliAccount;importjava.text.SimpleDateFormat;import......
快速上手Linux核心命令（五）：文本处理三剑客
@目录前言正则表达式第一剑客grep第二剑客sed第三剑客awk小结剑仙镇楼~O(∩_∩)O前言上一篇中已经预告，我们这篇主要说Linux文本处理三剑客。他们分别是grep、sed、awk。既然能被业界称为三剑客，可见其在Linux命令中占有举足轻重得地位。所以呢，这里也专门写一篇文章说一说......
hive数据从文本导入
1,建表语句(idint,namestring,ageint,telstring)ROWFORMATDELIMITEDFIELDSTERMINATEDBY'\t'STOREDASTEXTFILE;2,url.txt文本1 wyp25131888888888882test30138888888888883zs348993141213,加载......
pandas中的agg和rolling和asfreq
importpandasaspddf=pd.DataFrame({"col1":list(range(10)),"col2":list(range(1,11)),"col3":"2"*10})print(df.shape)print(df)#找出df中每列的最小值、最大值，生成新DataFrameprint(df.agg(['min','max'......
LLM（大语言模型）解码时是怎么生成文本的？
Part1配置及参数transformers==4.28.1源码地址：transformers/configuration_utils.pyatv4.28.1·huggingface/transformers(github.com)文档地址：Generation(huggingface.co)对于生成任务而言：text-decoder,text-to-text,speech-to-text,andvision-to-textmodels，有以......
Python pandas读取csv文件时数字变成科学计数法（含有e）
字段内容比较长时，Python读取会变成变成科学计数法（含有e）像这样importpandasaspsdata=ps.read_csv(r"E:\AppData\DongDong\Download\file\2023-04\BaseDataPriceDetail.csv",sep=',',usecols=[4])arrary=data.values[0::,0::]#读取全部行，全部列print(arrary[19])输出......
pandas.DataFrame—构建二维、尺寸可变的表格数据结构
语法格式pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=None)常用的几个参数解释：data:一系列数据，包括多种类型；index:索引值，行标签，默认值为RangeIndex(0,1,2,…,n)；columns:列标签，默认值为RangeIndex(0,1,2,…,n)；dtype:设置数据......
pandas.DataFrame.groupby—使用映射器或通过一系列列对数据框进行分组
语法格式DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=_NoDefault.no_default, squeeze=_NoDefault.no_default, observed=False, dropna=True)常用的几个参数解释：by:可接受映射、函数、标签或标签列表。用于确定分组。ax......
如何生成文本: 通过 Transformers 用不同的解码方法生成文本
简介近年来，随着以OpenAIGPT2模型为代表的基于数百万网页数据训练的大型Transformer语言模型的兴起，开放域语言生成领域吸引了越来越多的关注。开放域中的条件语言生成效果令人印象深刻，典型的例子有:GPT2在独角兽话题上的精彩续写，XLNet以及使用CTRL模型生成受控文本等......
SQL: PL/SQL打印用户表脚本文本
PLSQL打印用户表脚本文本环境：ORACLE19C createorreplacepackageCUX_util_pkg2is--Author:SAM--Created:2022/8/2110:20:39--Purpose:LONG_TO_CHAR--更新：2023/4/24,增加识别临时表----将ORACLELONG类型转为字符串类型FUNCTIONLON......