• 2024-07-04【2024datawhale 分子AI预测赛笔记】数据挖掘速通Baseline -分类/回归
    赛题概述精准预测分子性质有助于高效筛选出具有优异性能的候选药物。以PROTACs为例,它是一种三元复合物由目标蛋白配体、linker、E3连接酶配体组成,靶向降解目标蛋白质。(研究PROTACs技术在靶向降解目标蛋白质方面的潜力。)提醒:需要python和机器学习基础。赛事任务根据提
  • 2024-07-02机器学习笔记 LightGBM:理解算法背后的数学原理
    一、简述        在一次数据科学的比赛中,我有机会使用LightGBM,这是一种最先进的机器学习算法,它极大地改变了我们处理预测建模任务的方式。我对它在数千个数据点上进行训练的速度感到着迷,同时保持了其他算法难以达到的准确性。LightGBM是LightGradientBoostingMac
  • 2024-05-31Python实现SMA黏菌优化算法优化LightGBM回归模型(LGBMRegressor算法)项目实战
    说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后获取。1.项目背景黏菌优化算法(Slimemouldalgorithm,SMA)由Li等于2020年提出,其灵感来自于黏菌的扩散和觅食行为,属于元启发算法。具有收敛速度快,寻优能力强的特点。主
  • 2024-05-30mac(m1 pro芯片)上解决安装Lightgbm库失败问题
    报错日志执行pipinstalllightgbm时报错:CouldnotfindcompilersetinenvironmentvariableCC:gcc-8.CallStack(mostrecentcallfirst):CMakeLists.txt:32(project)CMakeError:CMAKE_C_COMPILERnotset,afterEnableLanguage
  • 2024-05-30为什么LightGBM如此之快
    为什么LightGBM如此之快模型解释树木叶子的生长Bins独家功能捆绑分布式学习参数Python代码文章最前:我是Octopus,这个名字来源于我的中文名–章鱼;我热爱编程、热爱算法、热爱开源。所有源码在我的个人github;这博客是记录我学习的点点滴滴,如果您对Python、Java、AI
  • 2024-05-29梯度提升机器LightGBM集成学习回归、分类、参数调优可视化实例|附数据代码
    全文链接:https://tecdat.cn/?p=36275原文出处:拓端数据部落公众号LightGradientBoostedMachine(简称LightGBM)是一个开源库,它为梯度提升算法提供了高效且有效的实现。LightGBM通过添加一种自动特征选择的方式,并专注于提升具有较大梯度的样本,来扩展梯度提升算法。这可以显著加速
  • 2024-05-26【Python】LightGBM:快速高效的梯度提升框架
    原谅把你带走的雨天在渐渐模糊的窗前每个人最后都要说再见原谅被你带走的永远微笑着容易过一天也许是我已经老了一点那些日子你会不会舍不得思念就像关不紧的门空气里有幸福的灰尘否则为何闭上眼睛的时候又全都想起了谁都别说让我一个人躲一躲你的承诺我竟
  • 2024-05-26【Python】 XGBoost vs LightGBM:两大梯度提升框架的对比
    原谅把你带走的雨天在渐渐模糊的窗前每个人最后都要说再见原谅被你带走的永远微笑着容易过一天也许是我已经老了一点那些日子你会不会舍不得思念就像关不紧的门空气里有幸福的灰尘否则为何闭上眼睛的时候又全都想起了谁都别说让我一个人躲一躲你的承诺我竟
  • 2024-04-10lightgbm筛选特征方法论
     特征相关性矩阵,实验的基础结论1:对于lgb,特征相关性越高,损失肯定越低 结论2:对于lgb,特征相关性正负作用是相同的,相关性=+0.76和相关性=-0.76完全相同 结论三:看红色文字,lgb有能力发现非线性特征的作用  结论四:x6和y的相关性最高,x2最低。但x2和x6的相关性是最低的
  • 2024-04-01每天一个数据分析题(二百四十四)
    LightGBM算法的哪些优化策略有助于提高模型的训练速度?A.Gradient-basedOne-SideSampling(GOSS)B.ExclusiveFeatureBundling(EFB)C.深度优先搜索(DFS)分裂D.使用L1正则化题目来源于CDA模拟题库点击此处获取答案
  • 2024-03-28机器学习中的LightGBM模型及其优缺点(包含Python代码样例)
    目录一、简介二、优缺点三、样例代码四、总结一、简介LightGBM(LightGradientBoostingMachine)是一种基于梯度提升(GradientBoosting)算法的机器学习模型。它是由微软团队于2017年开发的,旨在解决大规模数据下的效率和准确性问题。LightGBM的原理如下:基于梯度提升:Ligh
  • 2024-03-19Python贷款违约预测:Logistic、Xgboost、Lightgbm、贝叶斯调参/GridSearchCV调参
    原文链接:https://tecdat.cn/?p=35392原文出处:拓端数据部落公众号分析师:LinsengBo银行贷款业务是银行的主要盈利方式,对于具体的贷款申请人,是否可以同意贷款申请是一件十分重要的步骤,如果贷款人在贷款后出现违约行为,这将对银行的资金流稳定性造成不利的影响。因此针对贷款人的“
  • 2024-01-15怎么在python中改进lightgbm 算法
    改进LightGBM算法通常涉及一系列步骤,这取决于你的数据集、问题的特点以及已有模型的性能。以下是一些建议:数据预处理和特征工程:处理缺失值:使用适当的方法填充或删除缺失值。异常值处理:检测并处理异常值,以确保模型对数据的噪声具有鲁棒性。特征缩放:确保特征在相似的范围内,可以
  • 2024-01-14lightgbm 数据比较少怎么办
    当使用LightGBM处理相对较少的数据时,可以考虑以下一些方法:调整参数:在训练LightGBM模型时,可以通过调整参数来适应小规模的数据集。例如,减少num_leaves、max_depth等参数,以降低模型的复杂性。使用更轻量级的模型:如果数据集很小,可以考虑使用较小规模的模型,例如降低num_leaves或使用
  • 2024-01-08当lightgbm 数据比较少的时候怎么办
    当使用LightGBM(一种梯度提升框架)处理相对较少的数据时,可以考虑以下一些方法:调整参数:在训练LightGBM模型时,可以通过调整参数来适应小规模的数据集。例如,减少num_leaves、max_depth等参数,以降低模型的复杂性。使用更轻量级的模型:如果数据集很小,可以考虑使用较小规模的模型,例如降低n
  • 2023-12-19GBDT、XGBoost、LightGBM的区别和联系
    GBDT、XGBoost、LightGBM的区别和联系-简书https://www.jianshu.com/p/765efe2b951a深入理解LightGBM-知乎https://zhuanlan.zhihu.com/p/99069186WelcometoLightGBM’sdocumentation!—LightGBM3.2.1.99documentationhttps://lightgbm.readthedocs.io/en/latest/
  • 2023-12-18TSNAPred:通过集成方法预测类型特异性核酸结合残基
    TSNAPred:通过集成方法预测类型特异性核酸结合残基会议地点:腾讯会议期刊:BriefingsinBioinformatics作者:WenjuanNieandLeiDeng关键词:DNA-bindingresidues,RNA-bindingresidues,LightGBM,Capsulenetwork年份:2022论文博客论文地址代码地址论文:TSNA.pdf(1.5MB)主要内
  • 2023-11-18lightgbm
     test#coding=utf-8importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportmean_squared_error,mean_absolute_error,r2_scorefromsklearn.model_selectioni
  • 2023-08-26macbook pro install lightgbm
    前提是已经安装好了brew。若没有安装好brew可搜索安装brew,国内源即可。1,第一步,按装编译软件brewinstallopen-mpibrewinstallcmakebrewinstallgcc2,第二步,下载lightgbm网上大多使用这个地址克隆,但是国内访问会比较慢,有可能断线。gitclone--recursivegit://github.com/Mic
  • 2023-08-17机器学习-暑假学习01
    01赛题介绍用户新增预测挑战赛链接赛题数据由约62万条训练集、20万条测试集数据组成,共包含13个字段。其中uuid为样本唯一标识,eid为访问行为ID,udmap为行为属性,其中的key1到key9表示不同的行为属性,如项目名、项目id等相关字段,common_ts为应用访问记录发生时间(毫秒时间戳),其余字段
  • 2023-08-03LightGBM为什么比xgbost好?——选择梯度大(残差大)样本来进行特征分裂生成的树,借鉴了Adaboost的更改样本权重,错误的分类会更高权重对待
    LightGBM(LightGradientBoostingMachine)是一款基于决策树算法的分布式梯度提升框架。为了满足工业界缩短模型计算时间的需求,LightGBM的设计思路主要是两点:减小数据对内存的使用,保证单个机器在不牺牲速度的情况下,尽可能地用上更多的数据;减小通信的代价,提升多机并行时的效率,实现在
  • 2023-07-30AI夏令营-LightGBM的数学原理
    XGBoost提升集成学习模型的性能从基学习器本身入手从误差优化入手集成回归树的误差定义$argminL=\sum_{i=1}^nl(y_i,y_i^\Lambda)+\sum_{k=1}^K\Omega(f_k)$\(y_i\)是实际值,$y_i^\Lambda$是误差\(sl\Omega(f_k)=\gammaT+\frac{1}{2}\lambda\parallelw\p
  • 2023-03-28机器学习系列入门系列[七]:基于英雄联盟数据集的LightGBM的分类预测
    1.机器学习系列入门系列[七]:基于英雄联盟数据集的LightGBM的分类预测本项目链接:https://www.heywhale.com/home/column/64141d6b1c8c8b518ba97dcc1.1LightGBM原理简介L
  • 2023-03-22Python互联网大数据爬虫的武汉市二手房价格数据采集分析:Linear Regression模型、XGBoost模型和LightGBM模型
    全文链接:http://tecdat.cn/?p=31958原文出处:拓端数据部落公众号分析师:YanLiu我国有大量的资金都流入了房地产行业,同时与其他行业有着千丝万缕的联系,可以说房地产行业对
  • 2023-03-02XGBoost和LightGBM时间序列预测对比
    GBoost和LightGBM都是目前非常流行的基于决策树的机器学习模型,它们都有着高效的性能表现,但是在某些情况下,它们也有着不同的特点。XGBoost和LightGBM简单对比训练速度Li