clf
  • 2024-11-07样本不均衡与异常点检测处理|SMOTE|LOF|IForest
        在机器学习中,数据样本不均衡和异常值检测是数据科学家和机器学习工程师经常面临的挑战。这些问题如果不加以处理,会严重影响模型的性能和准确性。本文将概述这些问题,并提出相应的解决方案。样本不均衡概述在分类任务中,样本不均衡指的是不同类别的样本数量相差悬殊
  • 2024-10-01[python] 基于PyOD库实现数据异常检测
    PyOD是一个全面且易于使用的Python库,专门用于检测多变量数据中的异常点或离群点。异常点是指那些与大多数数据点显著不同的数据,它们可能表示错误、噪声或潜在的有趣现象。无论是处理小规模项目还是大型数据集,PyOD提供了50多种算法以满足用户的需求。PyOD的特点包括:统一且用户友
  • 2024-08-31基于Python的机器学习系列(16):扩展 - AdaBoost
    简介        在本篇中,我们将扩展之前的AdaBoost算法实现,深入探索其细节并进行一些修改。我们将重点修复代码中的潜在问题,并对AdaBoost的实现进行一些调整,以提高其准确性和可用性。1.修复Alpha计算中的问题        在AdaBoost中,如果分类器的错误率e为0,则
  • 2024-08-04【数学建模导论】Task04 机器学习
    前言Problem-BasedLearning.以解决问题为导向进行学习,培养工具思维本章会接触到大量的算法,一方面要理解算法的基本原理,另一方面又要能针对实际问题进行灵活应用。w(゚Д゚)w要长脑子了!我们完全可以把机器学习算法视作工具去使用。机器学习本身就是统计模型的延伸使用
  • 2024-07-05使用Python和scikit-learn实现支持向量机(SVM)
            支持向量机(SupportVectorMachine,SVM)是一种强大的监督学习算法,广泛用于分类和回归问题。它能够有效处理线性和非线性数据,并在复杂数据集中表现出色。本文将介绍如何使用Python和scikit-learn库实现SVM,以及如何通过可视化不同参数设置来理解其工作原理。一、
  • 2024-06-22Boosting原理代码实现
    1.提升方法是将弱学习算法提升为强学习算法的统计学习方法。在分类学习中,提升方法通过反复修改训练数据的权值分布,构建一系列基本分类器(弱分类器),并将这些基本分类器线性组合,构成一个强分类器。代表性的提升方法是AdaBoost算法。AdaBoost模型是弱分类器的线性组合:
  • 2024-06-21对红酒数据集,分别采用决策树算法和随机森林算法进行分类。
    1.导入所需要的包fromsklearn.treeimportDecisionTreeClassifierfromsklearn.ensembleimportRandomForestClassifierfromsklearn.datasetsimportload_winefromsklearn.model_selectionimporttrain_test_split2.导入数据,并且对随机森林和决策数进行对比 x_tr
  • 2024-05-31算法金 | 突破最强算法模型,决策树算法!!
    大侠幸会,在下全网同名「算法金」0基础转AI上岸,多个算法赛Top「日更万日,让更多人享受智能乐趣」1.引言今天我们唠唠吴恩达:机器学习的六个核心算法!之决策树算法。决策树是一种用于分类和回归的机器学习算法。它通过一系列的决策规则将数据逐步划分,最终形成一
  • 2024-05-31算法金 | 突破最强算法模型,决策树算法!!
    大侠幸会,在下全网同名「算法金」0基础转AI上岸,多个算法赛Top「日更万日,让更多人享受智能乐趣」1.引言今天我们唠唠吴恩达:机器学习的六个核心算法!之决策树算法。决策树是一种用于分类和回归的机器学习算法。它通过一系列的决策规则将数据逐步划分,最终形成一个类似
  • 2024-05-30机器学习_参数调优
    参数调优(HyperparameterTuning)是机器学习模型优化过程的重要部分,通过调整模型的超参数来提升其性能。以下详细讲解如何进行参数调优,并提供相应的代码实例。1.什么是超参数?超参数是在训练之前设置的参数,不同于模型训练过程中学到的参数(如权重)。决策树和随机森林的超参数
  • 2024-05-30机器学习_决策树与随机森林
    决策树和随机森林是常用的机器学习算法,尤其在分类和回归任务中应用广泛。以下详细介绍它们的用法,并提供相应的代码实例。决策树决策树是基于树结构的模型,逐步细化决策,最终形成对目标变量的预测。用法分类:用于分类任务,目标变量是类别。回归:用于回归任务,目标变量是连续值
  • 2024-05-26超简单白话文机器学习 - 回归树&树剪枝(含算法介绍,公式,源代码实现以及调包实现)
    1.回归树1.1算法介绍大家看到这篇文章时想必已经对树这个概念已经有基础了,如果不是很了解的朋友可以看看笔者的这篇文章:超简单白话文机器学习-决策树算法全解(含算法介绍,公式,源代码实现以及调包实现)_白话决策树-CSDN博客对于回归树的建立,我们一般使用CART回归树,CART(Clas
  • 2024-05-14实验2-鸢尾花分类
    VMware虚拟机Ubuntu20-LTSpython3.6tensorflow1.15.0keras2.3.1运行截图: 代码:fromsklearnimportdatasetsimportmatplotlib.pyplotaspltimportnumpyasnpfromsklearnimporttree#Iris数据集是常用的分类实验数据集,#由Fisher,1936收集整理。Iris也称鸢
  • 2024-02-21Python 机器学习工具 scikit-learn 的入门使用
    参考文档:https://www.scikitlearn.com.cn/通过对已有多组数据的训练,从而实现对单个数据的结果预测安装pipinstall-Uscikit-learnDemo通过使用sklearn包中的决策树DecisionTreeclassifier算法实现简单预测importsklearnfromsklearnimporttreefeature=[[178,1],
  • 2024-01-20深度学习-神经网络原理-39
    目录1.神经网络算法是有监督的学习算法,2.分类3.训练4.代码进入新的内容,深度学习啦万事万物的产生不是一下子就变出来的,学术上也是,一点点的进步才催生出一门新的学科或者技术,神经网络用于机器学习也不例外,前面的机器学习的内容,线性回归,逻辑回归,多分类,决策树,以及各种集成学习
  • 2023-12-04toad最终版中间带循环
    KS循环testks=pd.ExcelWriter('test1.xlsx')columns_df=pd.DataFrame(mx2.columns)fori,jinenumerate(mx2.columns):result=toad.metrics.KS_bucket(mx[j],mx['target'],bucket=10,method='quantile').sort_index()result.to_excel(testk
  • 2023-11-11【深度学习笔记】第3章-神经网络基础
    参考书籍:邓立国等《python深度学习原理、算法与案例》清华大学出版社3.3感知机3.3.1感知机模型感知机,又称阈值逻辑单元(ThresholdLogicUnit,TLU)/线性阈值单元(LinearThresholdUnit,LTU)经典数据集:IrisDataSet(鸢尾属植物数据集)但是这个数据集有些复杂,没什么必要用,自己写
  • 2023-11-055. Sklearn岭回归
    1.线性回归\[w=(X^TX)^{-1}X^TY\]对于矩阵X,若某些列线性相关性较大(即训练样本中某些属性线性相关),就会导致\(X^TX\)的值接近0,在计算\((X^TX)^{-1}\)时就会出现不稳定性。结论:传统的基于最小二乘的线性回归法缺乏稳定性2.岭回归通常情况下会引入正则化(regularization)
  • 2023-09-039-3|使用Python的scikit-learn库来训练一个逻辑回归模型,检测句子是否含有侮辱性内容:
    当然可以。以下是一个简单的例子,使用Python的`scikit-learn`库来训练一个逻辑回归模型,检测句子是否含有侮辱性内容:```pythonfromsklearn.feature_extraction.textimportTfidfVectorizerfromsklearn.linear_modelimportLogisticRegressionfromsklearn.model_selectionim
  • 2023-08-25stjzoi-2022
    在jzsc的时候豪哥就已经跟我们说好了7.13要来参加上一次在上半学期的复赛因为疫情,拖了一个学期,终于有了下文了在古老的初赛中以80/100的成绩进了复赛从jzsc回来后,跟父母说好了,参加比赛后要AFO直到作业写完但是由于我的期末考考的十分【数据删除】所以作业一大堆又因为初二的O
  • 2023-06-14opcenter camstar designer基础知识-- Functions
     已编写函数来执行各种任务,如简单的算术、搜索复杂的数据结构、数据库查询、报告编写、数据收集、数据验证等等。函数具有零个或更多参数,并且由ActiveX组件实施。包含在CLF中的函数可以执行工作。函数有权访问系统的内部对象设计,它通过操纵该设计来完成工作。以下主题提供有
  • 2023-06-01常用的boosting算法
    boosting算法有许多种具体算法,包括但不限于adaboosting\GBDT\XGBoost。adaboosting原始数据集》某种算法拟合,会产生错误》根据上个模型预测结果,更新样本点权重(预测错误的结果权重增大)》再次使用模型进行预测》重复上述过程,继续重点训练错误的预测样本点。adabo
  • 2023-05-31决策树
    决策树​ 决策树是一种机器学习的方法。决策树的生成算法有ID3(信息增益),C4.5(信息增益率)和CART(Gini系数)等。决策树是一种树形结构,其中每个内部节点表示一个属性上的判断,每个分支代表一个判断结果的输出,最后每个叶节点代表一种分类结果。​ 构造树的基本想法是随着树深度的增加,节
  • 2023-05-17文本分类(上)- 基于传统机器学习方法进行文本分类
    简介自己由于最近参加了一个比赛“达观杯”文本智能处理挑战赛,上一周主要在做这一个比赛,看了一写论文和资料,github上搜刮下。。感觉一下子接触的知识很多,自己乘热打铁整理下吧。接着上一篇文章20newsgroups数据介绍以及文本分类实例,我们继续探讨下文本分类方法。文本分类作为NLP领
  • 2023-04-26机器学习(七):梯度下降解决分类问题——perceptron感知机算法与SVM支持向量机算法进行二维点分类
    实验2感知机算法与支持向量机算法一、预备知识1.感知机算法二、实验目的掌握感知机算法的原理及设计;掌握利用感知机算法解决分类问题。三、实验内容设计感知机算法求解,设计SVM算法求解(可调用函数库),请找出支持向量和决策超平面。四、操作方法和实验步骤1.