- 2024-10-10Pandas测试Excel文件:fillna()与strip()相互作用的影响
遇见的问题np.nan被strip之后仍为nan,但是此nan无法被.fillna()处理,处理后仍然为nanget_address_local_mail['CountryID_mail']=get_address_local_mail['CountryID_mail'].apply(lambdax:np.nanifx=="00000000-0000-0000-0000-000000000000"orx==&
- 2024-04-15PandasTA 源码解析(十一)
.\pandas-ta\pandas_ta\overlap\wcp.py#-*-coding:utf-8-*-#从pandas_ta库中导入Imports模块frompandas_taimportImports#从pandas_ta.utils中导入get_offset和verify_series函数frompandas_ta.utilsimportget_offset,verify_series#定义函数wcp
- 2024-04-15PandasTA 源码解析(十)
.\pandas-ta\pandas_ta\overlap\sma.py#-*-coding:utf-8-*-#从pandas_ta库中导入Imports对象frompandas_taimportImports#从pandas_ta.utils模块中导入get_offset和verify_series函数frompandas_ta.utilsimportget_offset,verify_series#定义简单
- 2024-04-15PandasTA 源码解析(十三)
.\pandas-ta\pandas_ta\trend\decreasing.py#-*-coding:utf-8-*-#从pandas_ta.utils模块中导入所需函数和类frompandas_ta.utilsimportget_drift,get_offset,is_percent,verify_series#定义一个名为decreasing的函数,用于计算序列是否递减defdecreasing(clo
- 2024-04-15PandasTA 源码解析(十二)
.\pandas-ta\pandas_ta\statistics\stdev.py#-*-coding:utf-8-*-#从numpy导入sqrt函数,并将其命名为npsqrtfromnumpyimportsqrtasnpsqrt#从variance模块导入variance函数from.varianceimportvariance#从pandas_ta模块导入Imports类frompandas_
- 2024-04-15PandasTA 源码解析(十五)
.\pandas-ta\pandas_ta\utils\_signals.py#-*-coding:utf-8-*-#导入DataFrame和Series类frompandasimportDataFrame,Series#导入自定义函数from._coreimportget_offset,verify_seriesfrom._mathimportzero#定义函数_above_below,用于比较两个Seri
- 2024-04-15PandasTA 源码解析(十七)
.\pandas-ta\pandas_ta\volume\adosc.py#-*-coding:utf-8-*-#导入ad模块from.adimportad#从pandas_ta库中导入Imports模块frompandas_taimportImports#从pandas_ta.overlap模块中导入ema函数frompandas_ta.overlapimportema#从pandas_ta.util
- 2024-04-15PandasTA 源码解析(四)
.\pandas-ta\pandas_ta\momentum\cg.py#-*-coding:utf-8-*-#从pandas_ta.utils中导入get_offset,verify_series,weights函数frompandas_ta.utilsimportget_offset,verify_series,weights#定义CenterofGravity(CG)指标函数defcg(close,length=None,
- 2024-04-15PandasTA 源码解析(六)
.\pandas-ta\pandas_ta\momentum\rsi.py#-*-coding:utf-8-*-#导入所需模块和函数frompandasimportDataFrame,concatfrompandas_taimportImportsfrompandas_ta.overlapimportrmafrompandas_ta.utilsimportget_drift,get_offset,verify_series,signals
- 2024-04-15PandasTA 源码解析(五)
.\pandas-ta\pandas_ta\momentum\kst.py#-*-coding:utf-8-*-#导入DataFrame类frompandasimportDataFrame#导入roc函数from.rocimportroc#导入验证序列函数、获取漂移和偏移的函数frompandas_ta.utilsimportget_drift,get_offset,verify_series#定义
- 2024-04-15PandasTA 源码解析(七)
.\pandas-ta\pandas_ta\momentum\stc.py#-*-coding:utf-8-*-从pandas库中导入DataFrame和Series类从pandas_ta.overlap模块中导入ema函数从pandas_ta.utils模块中导入get_offset、non_zero_range和verify_series函数#定义函数:SchaffTrendCycle(STC
- 2024-02-17pandas 缺失值、异常值提取和处理
forcolumnameindf.columns:#遍历每一列ifdf[columname].count()!=len(df):#判断缺失行条件:所在列的值数等于总数据的长度#将存在缺失值的行的索引转换成列表储存loc=df[columname][df[columname].isnull().values==True].index.tolist()
- 2023-10-01基于pandas的数据清洗 -- 缺失值(空值)的清洗
博客地址:https://www.cnblogs.com/zylyehuo/开发环境anaconda集成环境:集成好了数据分析和机器学习中所需要的全部环境安装目录不可以有中文和特殊符号jupyteranaconda提供的一个基于浏览器的可视化开发工具丢失数据的类型原始数据中会存在两种缺失值(空值)None
- 2023-09-24每日总结
今日学习了spark的数据清洗ui#数据去重df.dropDuplicates().show()#带参数去重df.dropDuplicates(['age','job']).show()#去除空值df.dropna().show()#最少满足三个有效列df.dropna(thresh=3).show()#满足name和age有效df.dropna(thresh=2,subset=['name','age']).show()
- 2023-09-09验证 fillna(method='ffill')
df=pd.DataFrame({'col1':[1,np.nan,3],'col2':[1,np.nan,np.nan],'col3':[np.nan,2,np.nan]})df.fillna(method='ffill')验证 fillna(method='ffill')pandas.DataFrame.fillna()是Pandas中用于填充缺失数据(NaN或None
- 2023-07-27【AI夏令营】NLP赛题解析与Baseline逐行精读
【任务】1.深入研读baseline代码,仔细理解其每个部分,并记录详尽的学习笔记;2.主动挑战自己,对基线代码进行优化,力求改进代码的实际效果和性能;3.完成任务二,并查看个人成绩排行榜。【Baseline精读】本次主要是针对任务二(关键词提取,也会有部分任务一的内容)首先是库文件的导入:#