df2
  • 2024-09-27Pandas -----------------------基础知识(五)
    索引和列操作函数缺失值索引和列操作#1加载数据#1.1从链家租房数据集中获取天通苑租房区域的所有数据存储在df2中#1.2从df2中获取价格列存储在df2_price对象importpandasaspddf=pd.read_csv('/root/pandas_code_ling/data/b_LJdata.csv')df2=df[df['区
  • 2024-09-27Pandas常用计算函数
    Pandas常用计算函数学习目标知道排序函数nlargest、nsmallest和sort_values的用法知道Pandas中求和、计数、相关性值、最小、最大、平均数、标准偏差、分位数的函数使用1排序函数导包并加载数据集importpandasaspd#加载csv数据,返回df对象df=pd.read_csv('
  • 2024-09-24获取两个 DataFrame 中某两列相同的项
    要获取两个DataFrame中某两列相同的项,可以使用pandas的merge方法或isin方法。以下是两种方法的示例。方法1:使用mergemerge方法可以用来根据多个列将两个DataFrame合并。通过设置how='inner',可以得到两个DataFrame中在指定列上相同的项。importpandasaspd
  • 2024-08-15python 计算中位数、四分位数、最大值、最小值等
    还是之前的那一堆csv数,主要算每列的中位数、四分位数、最大值、最小值等我在这里做个笔记,方便下次用的时候直接粘过来用#!usr/bin/envpython#-*-coding:utf-8-*-"""@author:Suyue@file:vilolinpic.py@time:2024/08/13@desc:"""importpandasaspddf=pd.rea
  • 2024-08-12Pandas从入门到放弃
    公众号本文地址:https://mp.weixin.qq.com/s/mSkA5KvL1390Js8_1ZBiywPandas简介Pandas是Paneldata(面板数据)和Dataanalysis(数据分析)的缩写,是基于NumPy的一种工具,故性能更加强劲。Pandas在管理结构数据方面非常方便,其基本功能可以大致概括为一下5类:数据/文本文件读取;索引
  • 2024-08-11【数据分析---- Pandas进阶指南:核心计算方法、缺失值处理及数据类型管理】
    前言:
  • 2024-06-23python基础 - 数据实战
    """数据挖掘的流程:1-获取数据1-从固有的本地获取2-互联网动态获取2-存储数据1-大量数据数据库2-部署太大数据--使用文件存储:1-txt2-excel3-csv3-清洗数据4-算法的介入5-结果展示6-分析汇总"""importrequests,timeimportpprint,csvimportthrea
  • 2024-06-07Pandas碎碎念1 - Dataframe 合并之 join,concat,merge,append
    最近做的几个项目都要经常使用pandas操作excel,中间也遇到了不少坑,简单记录一下吧。套用骁哥的一句话,让自己变得更强!Pandas中有几种常见的合并dataframe的方法,join,concat,merge,append。下面来尝试一下:首先来做一些测试数据data1={'Src':[1,2,3,4],'Mid'
  • 2024-05-25ARIMA时间序列模型水质预测应用
    ARIMA时间序列模型简介时间序列是研究数据随时间变化而变化的一种算法,是一种预测性分析算法。它的基本出发点就是事物发展都有连续性,按照它本身固有的规律进行。ARIMA(p,d,q)模型全称为差分自回归移动平均模型(AutoregressiveIntegratedMovingAverageModel,简记ARIMA).
  • 2024-04-30编辑
    !/usr/bin/envpythoncoding:utf-8In[63]:importpandasaspdimportnumpyasnpimportpymysqlconn=pymysql.connect(host="10.101.2.32",user="chenqianguang",passwd="select20",db='clx_loan')sql='''&#
  • 2024-04-28最近常用的几个【行操作】的Pandas函数
    最近在做交易数据的统计分析时,多次用到数据行之间的一些操作,对于其中的细节,简单做了个笔记。1.shfit函数shift函数在策略回测代码中经常出现,计算交易信号,持仓信号以及资金曲线时都有涉及。这个函数的主要作用是将某列的值上下移动。默认情况下,shift函数是向下移动一行,移动后,新
  • 2024-03-22数据清洗5
    merge函数:pd.merge(df1,df2,how='inner')#双表连接将两个表共有的数据连接结#后面如果是on的话就是以哪一行为标准进行链接pd.merge(df1,df2,on=['name'])#name这一列作为标准进行链接name是共同的列pd.merge(df1,df2,on=['name'],how='left')#以name为标准链接,但是向
  • 2024-02-04R语言LASSO特征选择、决策树CART算法和CHAID算法电商网站购物行为预测分析
    全文链接:http://tecdat.cn/?p=32275原文出处:拓端数据部落公众号本文通过分析电子商务平台的用户购物行为,帮助客户构建了一个基于决策树模型的用户购物行为预测分析模型。该模型可以帮助企业预测用户的购物意愿、购物频率及购买金额等重要指标,为企业制定更有针对性的营销策略提供
  • 2024-02-01寒假生活指导24
    #coding:utf8#指定源代码编码格式为UTF-8frompyspark.sqlimportSparkSession#导入SparkSession类,用于创建和管理Spark应用上下文frompyspark.sql.functionsimportconcat,expr,col#导入SparkSQL中的函数,这里并未使用但可能在后续操作中用于数据转换或计算f
  • 2023-12-27和鲸-numpy+pandas使用基础 关卡1
    STEP1:按照下列要求创建数据框已知10位同学的学号以及语数英三科成绩如下:(都是数值型数据)Id:[202001,202002,202003,202004,202005,202006,202007,202008,202009,202010]Chinese:[98,67,84,88,78,90,93,75,82,87]Math:[92,80,73,76,88,78,90,82,7
  • 2023-12-19期末复习-基于python的数据整理
    一、pandas数据合并pd.concat()append()pd.merge()1.1pd.concat()函数pandas的pd.concat函数和numpy的np.concatenate函数类似1)简单的合并defmake_df(indexs,columns):data=[[str(j)+str(i)forjincolumns]foriinindexs]df=pd.DataFrame(data=data
  • 2023-12-06pandas学习
    #载入包importpandasaspdimportnumpyasnp一、文件导入导出读取文件1、读取txt文件或csv文件importpandasaspdimportnumpyasnpdf1=pd.read_csv('D:/personal_file/python/code/births1881.txt',sep=',',#默认逗号分隔符he
  • 2023-12-06Python - pandas DataFrame数据的合并与拼接(merge、join、concat)
    Python-pandasDataFrame数据的合并与拼接(merge、join、concat)0概述pandas包的merge、join、concat方法可以完成数据的合并和拼接。merge方法主要基于两个dataframe的共同列进行合并;join方法主要基于两个dataframe的索引进行合并;concat方法是对series或dataframe进行行
  • 2023-12-06pandas函数映射
    pandas函数映射importpandasaspdimportnumpyasnpfrompandasimportSeries,DataFramedf1=DataFrame(np.random.choice(range(20),size=(4,3),replace=False),index=list('ABCD'),columns=list('abc'))print(df1)#使用numpy函
  • 2023-12-06Pandas数据处理:空值清洗、替换填充、级联与合并拼接
    Pandas数据处理:空值清洗、替换填充、级联与合并拼接针对空值的处理,首先要来了解一下空值的类型:一、pandas中的None和NaN有什么区别?type(None)--类型是NoneType空的对象类型type(NaN)--类型是float浮点型注意:Pandas中None和NaN都视作np.nan二、Pandas的空值
  • 2023-11-13关于Dataframe数据保存出现的问题
    问题描述:读入csv文件,执行以下程序importpandasaspdimportnumpyasnp#pd.set_option('max_colwidth',2000)sub_file_name="submission.csv"df=pd.read_csv(sub_file_name,header=None)pro_file_name="problem.csv"df2=pd.read_csv(pro_fi
  • 2023-11-023个Excel表格中每个门店物品不同,想要汇总在一起(方法三)
    大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Python自动化办公处理的问题,一起来看看吧。上一篇文章中,我们已经看到了第一种解决办法了,这一篇文章我们一起来看看另外一种方法。二、实现过程这里【瑜亮老师】给了一个代码和思路,如下所示:`# 读取E
  • 2023-10-27# yyds干货盘点 # df2贷款余额,求和想保留两位小数,但结果无效,怎么破?
    大家好,我是皮皮。一、前言前几天在Python最强王者交流群【斌】问了一个Pandas数据处理的问题,一起来看看吧。麻烦大佬再帮忙看一下:df2贷款余额,求和想保留两位小数,但结果无效。是不是因为第二行的缘故?二、实现过程这里粉丝查了一下,贷款余额是float64,把第二行去掉,依然还是无法保留两位
  • 2023-10-23Pandas在合并数据的时候,发现部分数据缺失,该怎么解决?
    大家好,我是皮皮。一、前言前几天在Python最强王者群【wen】问了一个Pandas数据合并的问题,一起来看看吧。请教:对两个exlce表示进行合并,df=pd.merge(df1,df2,on="用户账号",how='left'),但是由于系统数据的原因,df1表格的“用户账户”缺少最后两位数,而df2中的“用户账户”是准确的,通过
  • 2023-09-22python的pandas库:合并数据
    在Pandas中,如果你有两个数据框(DataFrames),且它们的列数和列名都相同,你可以使用concat或merge函数将它们合并。以下是具体步骤:首先,导入Pandas库:importpandasaspd创建两个列数和列名都相同的数据框:df1=pd.DataFrame({'A':['A0','A1','A2','A3'],'B':[�