- 2025-01-01人工智能知识分享第五天-正则化.损失函数案例
正则化欠拟合与过拟合过拟合:一个假设在训练数据上能够获得比其他假设更好的拟合,但是在测试数据集上却不能很好地拟合数据(体现在准确率下降),此时认为这个假设出现了过拟合的现象。(模型过于复杂)欠拟合:一个假设在训练数据上不能获得更好的拟合,并且在测试数据集上也不
- 2024-12-02Timeseries Prediction Demo base on LSTM
示例代码importjsonimporttimeimportdatetimeimportrequestsasreqimportnumpyasnpimportpandasaspdimportmatplotlib.pyplotaspltfromsklearn.preprocessingimportMinMaxScalerfromtensorflow.keras.modelsimportSequentialfromtensorflow.ke
- 2024-12-13Ansible实验
一、实验环境二、实验步骤剧本编写遵循yaml语法:冒号(冒号后面需要空格)短横杠(后面跟空格)缩进(两字符,默认Tab键四个字符)playbook语法:ansible-playbook选项文件路径选项:--list-hosts:列出清单--list-tasks:列出任务--list-tags:列出标签--syntax-check:语法检查核心
- 2024-12-06洛谷 P11362 [NOIP 2024] 遗失的赋值
题目传送门如果没有其他限制,那么一个二元限制可能出现的方案数为\(v^2\)。考虑\(\{x_n\}\)的一个区间,设其中能放\(t\)个二元限制,它的左右端点有一元限制,求这\(t\)个限制的方案数。设这个数为\(f(t)\)。如果第一个二元限制的\(a\)与左端点\(i\)处的\(x\)值相同,那
- 2024-09-27李宏毅机器学习2023-HW10-Adversarial Attack
文章目录TaskBaselineFGSM(FastGradientSignMethod(FGSM)I-FGSM(IterativeFastGradientSignMethod)MI-FGSM(MomentumIterativeFastGradientSignMethod)M-DI2-FGSM(DiverseInputMomentumIterativeFastGradientSignMethod)ReportfgsmattackJepgCom
- 2024-09-04Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Model(2024,8)
Transfusion:PredicttheNextTokenandDiffuseImageswithOneMulti-ModalModel(2024,8)PaperTODO:目前没有开源代码,实时关注一下officialcode,Meta的工作基本开源的.本文给出了一种新的T2I的方法.lucidrains的代码本质是将LLM的transformer和图像中的diffusion结
- 2024-08-30机器学习:集成学习之随机森林
目录前言一、集成学习1.集成学习的含义2.集成学习的代表3.集成学习的应用二、随机森林1.随机森林的特点2.随机森林生成步骤3.随机森林优点4.随机森林的缺点三、代码实现1.完整代码2.数据预处理3.创建并训练模型4.测试模型总结前言 随机森林
- 2024-08-30LLaMA-Factory微调入门个人重制版
LLaMA-Factory微调入门个人重制版说明:首次发表日期:2024-08-30LLaMA-Factory官方Github仓库:https://github.com/hiyouga/LLaMA-Factory关于本文是对LLaMA-Factory入门教程https://zhuanlan.zhihu.com/p/695287607的个人重制版,记录一下学习过程,省略掉了很多文字部分,建议
- 2024-08-28[Paper Reading] Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Model
Transfusion:PredicttheNextTokenandDiffuseImageswithOneMulti-ModalModellink时间:24.08机构:Waymo&UniversityofSouthernCaliforniaTL;DR提出一种使用混合模态token来训练transformer,名为transfusion,是一种生成式AI模型。主要工作使用了2T的tokens结合语言
- 2024-08-25机器学习:随机森林决策树学习算法及代码实现
1、概念 随机森林(RandomForest)是一种集成学习方法,它通过构建多个决策树来进行分类或回归预测。随机森林的核心原理是“集思广益”,即通过组合多个弱学习器(决策树)的预测结果来提高整体模型的准确性和健壮性。2、集成学习(EnsembleLearning): 集
- 2024-08-23【LLM & RAG & text2sql】大模型在知识图谱问答上的核心算法详细思路及实践
前言本文介绍了一个融合RAG(Retrieval-AugmentedGeneration)思路的KBQA(Knowledge-BasedQuestionAnswering)系统的核心算法及实现步骤。KBQA系统的目标是通过自然语言处理技术,从知识图谱中提取和生成精确的答案。系统的实现包括多个关键步骤:mention识别、实体链接及排序、属
- 2024-08-20机器学习-下采样(全网最详解)
文章目录相关介绍逻辑回归不平衡数据集下采样逻辑回归与下采样结合下采样运用1.导入相关包2.数据预处理3.数据下采样与合并4.绘制下采样图像5.划分数据集6.模型训练与评估7.阈值调整与性能评估总结1.下采样的优点2.下采样的缺点相关介绍逻辑回归逻辑回归是一
- 2024-08-05机器学习-线性回顾
线性回归线性回归1.简介2.线性回归问题求解3.欠拟合与过拟合线性回归1.简介"""简介: 定义: 利用回归方程对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的一种分析方式 公式: 见下图 分类: 一元线性回归: 目标值与一个因变量有关
- 2024-07-29深度学习与图像识别day5(机器学习基础)
线性问题主要处理回归问题,回归问题即预测一个连续问题的数值。计算决定系数(R-squared,也称为R²或系数决定)是衡量回归模型预测准确性的一个常用指标。R-squared值越接近1,表示模型的预测性能越好;如果R-squared值为0,则表示模型只是简单地预测了目标变量的平均值;如果R-squared值为负,
- 2024-07-12基于VGG16特征提取与聚类优化的苹果分类系统开发与性能提升
数据集链接:https://pan.baidu.com/s/1qQglNzAIkBNxdrwND0NLNQ?pwd=data 提取码:data1.目的任务:根据original_data样本数据,建立模型,对test的图片进行普通/其他苹果判断 1.数据增强,扩充确认为普通苹果的样本数量 2.特征提取,使用VGG16模型提取特征 3.图片批量处理
- 2024-07-10基于单层LSTM模型的文本序列预测:从预处理到字符预测的完整流程
数据集我的数据集就是重复的两句话,重复了几百次。引言在自然语言处理(NLP)领域,序列预测是一个非常重要的任务,它涉及到根据已有的文本序列来预测接下来的内容。近年来,循环神经网络(RNN)及其变体,如长短时记忆网络(LSTM),因其能够有效处理序列数据中的长期依赖关系而广受青睐。本博客
- 2024-07-07昇思25天学习打卡营第11天 | LLM原理和实践:基于MindSpore实现BERT对话情绪识别
1.基于MindSpore实现BERT对话情绪识别1.1环境配置#实验环境已经预装了mindspore==2.2.14,如需更换mindspore版本,可更改下面mindspore的版本号!pipuninstallmindspore-y!pipinstall-ihttps://pypi.mirrors.ustc.edu.cn/simplemindspore==2.2.14#该案例在min
- 2024-06-24[本科项目实训] P-Tuning v2 测试记录
测试脚本PRE_SEQ_LEN=64CHECKPOINT=dsbtpg-chatglm-6b-pt-64-2e-2STEP=500CUDA_VISIBLE_DEVICES=0python3main.py\--do_predict\--validation_filedevVX.json\--test_filedevVX.json\--overwrite_cache\--prompt_columncontent\
- 2024-06-24机器学习(二)
机器学习3.分类算法3.1sklearn转换器和估计器3.1.1转换器3.1.2估计器(在sklearn实现机器学习算法)3.2K-近邻算法3.2.1什么是K-近邻算法3.2.2K-近邻算法API3.2.3案例:鸢尾花种类预测3.2.4K-近邻总结3.3模型选择与调优3.3.1交叉验证(crossvaildation)3.3.2超参