首页 > 编程语言 >一些不错的python 特征工程包

一些不错的python 特征工程包

时间:2023-10-27 14:38:25浏览次数:38  
标签:engine github python com scikit feature 特征 learn 不错

特征工程在机器学习中是比较重要的,而且也是比较花费时间的,而且对于不同场景的业务(序列,机器视觉,NLP)
会有不同的处理方式,整理了一些日常使用比较多的工具,可以参考

工具包

  • scikit-learn 
    比较老牌了,提供了不少特征工程的工具包,同时也提供了不少相关的算法实现
  • autofeat 
    实现上与scikit-learn 类似,可以进行一些自动处理
  • tsfresh 
    比较适合进行时序数据的特征处理
  • featuretools 
    一个自动化的特征处理框架,使用了DFS 进行处理,比较强大的是可以支持不少其他周边的集成(spark,dask,scikit-learn,tsfresh)
  • feature_engine 
    类似scikit-learn的处理,同时和scikit-learn 集成也很不错,可以说是提供了不少scikit-learn的扩展

参考资料

https://scikit-learn.org/stable/modules/feature_selection.html

https://github.com/cod3licious/autofeat

https://github.com/blue-yonder/tsfresh

https://github.com/alteryx/featuretools

https://www.featuretools.com/

https://github.com/feature-engine/feature_engine

https://feature-engine.trainindata.com/en/latest/index.html

标签:engine,github,python,com,scikit,feature,特征,learn,不错
From: https://blog.51cto.com/rongfengliang/8056082

相关文章

  • 删除Python的安装目录
    删除Python的安装目录的步骤如下:1.打开文件资源管理器1。2.导航到Python的安装目录。默认情况下,Python的安装目录通常位于C:\\PythonXX,其中XX代表你安装的Python版本号2。如果你在安装时选择了其他位置,那么就导航到那个位置1。3.选中Python的安装目录,然后右键点击选择"删除"1......
  • 使用vscode编译python
    使用vscode编译python1.需要提前安装python,vscodewin10安装python32.在vscode中安装Python插件a.在vscode中高效率的编辑Python代码,需要安装Python插件,点击图1中红框内的按钮b.在左上角的搜索框中输入:Python,如图2所示,点击图2中红框内的按钮安装插件,点击后红框内的......
  • 删除Python的安装目录
    删除Python的安装目录的步骤如下:1.打开文件资源管理器1。2.导航到Python的安装目录。默认情况下,Python的安装目录通常位于C:\\PythonXX,其中XX代表你安装的Python版本号2。如果你在安装时选择了其他位置,那么就导航到那个位置1。3.选中Python的安装目录,然后右键点击选择"删除"1......
  • ChatGPT 实用小案例分享——使用Python重命名附件和统计发票合计金额
    大家好,我是皮皮。一、前言前几天在【志军】的星球看到了一个有意思的ChatGPT分享,正好喝Python相关的,一起来看看吧。ChatGPT实用小案例分享。如果你在高德或者滴滴上申请过开票,应该知道它们会给我们发一封邮件,发票和行程单都会放在附件中。由于高德是聚合平台,背后有很多网约车平台,......
  • 系统提取的部分数据存在异常,Python填充有其他更简单的方法么?
    大家好,我是皮皮。一、前言前几天在Python最强王者群【wen】问了一个Python自动化办公的问题,一起来看看吧。请教问题:友信平台因为系统提取的部分数据存在异常,导出的数据经常缺失客户名,但是客户账号是准确的,如果实现客户名自动填充?解决思路:1单独生成客户账号和客户名的表格,两个表格进......
  • 怎么用Python写一个浏览器集群框架
    这是做什么用的框架用途在采集大量新闻网站时,不可避免的遇到动态加载的网站,这给配模版的人增加了很大难度。本来配静态网站只需要两个技能点:xpath和正则,如果是动态网站的还得抓包,遇到加密的还得js逆向。所以就需要用浏览器渲染这些动态网站,来减少了配模板的工作难度和技能要求......
  • 教你如何实现图片特征向量提取与相似度计算
    图片特征向量是一种用于描述图片内容的数学表示,它可以反映图片的颜色、纹理、形状等信息。图片特征向量可以用于做很多事情,比如图片检索、分类、识别等。本文将介绍图片特征向量的提取以及相似度的计算,并使用C#来实现它们。文章开始前,我们先来简单了解一下OpenCV和OpenCvSha......
  • graalvm 23.1.0 python 试用
    graalvm23.1.0开始python集成也做为一个独立的包了,同时官方文档也有一些安装说明,比如下载包的,基于pyenv的目前pyenv的是不成功的(repo似乎还没更新)安装直接使用安装包,直接可以github下载,包含了不同的版本,直接可以下载企业版使用参考代码app.py print("demo")运行可以通过gr......
  • python+playwright 学习-83 page.expect_response()捕获网络返回数据
    前言expect_response()方法可以捕获接口返回的数据,在爬取网页数据时非常有用。expect_response()使用官方文档示例withpage.expect_response("https://example.com/resource")asresponse_info:page.get_by_text("triggerresponse").click()response=response_info.val......
  • python+playwright 学习-82 Request 对象
    前言每当页面发送网络资源请求时,页面都会发出以下事件序列:page.on("request")当页面发出请求时触发page.on("response")接收到请求的响应状态和标头时触发page.on("requestfinished")当响应主体被下载并且请求完成时发出。如果请求在某个时刻失败,则会发出page.on("requestfa......