集上

2025-01-02（三）深度神经网络
激活函数：添加非线性因素θ代表所有未知参数过拟合和欠拟合是复试重点（解决办法）在训练集上再好都没用呀，在测试集上好才是真的好去b站找小甲鱼学python到字典
2024-12-23YOLO的发展历史
YOLOv1（2015）：发布时间：2015年开发团队：JosephRedmon,SantoshDivakaran,RossGirshick,AliFarhadi，来自华盛顿大学和FacebookAIResearch。改进内容：首次提出将目标检测作为一个回归问题，直接从图像预测边界框和类别概率。作用：简化了目标检测流程，提高了检测速度。效果：在PASCAL
2024-12-23NLP论文速读|如何在没有模型崩溃的情况下合成文本数据？
论文速读|HOWTOSYNTHESIZETEXTDATAWITHOUT MODELCOLLAPSE?论文信息：简介：本文讨论了在人工智能（AI）模型训练中，合成数据（syntheticdata）的使用可能导致模型崩溃（modelcollapse）的问题。随着生成性AI技术的发展，合成数据在网络数据生态系统中变得越来越普遍，未来
2024-12-13顶会投稿，轻松涨点！Transformer+UNet新突破!
今天给大家推荐一个涨点发顶会的好方向：Transformer+UNet。这俩热点的结合可以轻松实现“1+1＞2”的效果。医学图像分割的重要性：医学图像分割在医学领域具有很高的落地价值，它对于辅助医生判断和改善患者体验至关重要。Transformer和UNet的互补性：Transformer擅长处理长距离依赖
2024-12-12论文阅读：Statistical Comparisons of Classifiers over Multiple Data Sets
论文地址：StatisticalComparisonsofClassifiersoverMultipleDataSets(acm.org)前面在机器学习之Friedman检验-CSDN博客中提到了Friedman检验，这里将对这个方法的论文进行详细的阅读，以了解其原理。摘要尽管用于在单个数据集上比较两种学习算法的方法已经研究了相当
2024-12-12数据增强技术在医学图像处理中的应用场景及实例分析｜个人观点·24-12-12
小罗碎碎念知识星球答疑今天在知识星球里收到了一个用户的提问，我觉得这个问题比较具有代表性，所以专门写一篇推送分析一下数据增强在医学影像中的应用。提问的人没有给出具体的包，所以我只能介绍一下我自己处理数据增强问题的思路。我会更关注模型，其次才是包——我首选
2024-12-07吉林大学2024机器学习A期末知识点归纳（第二章，线性回归）
首先，要理解，线性模型是机器学习中的一种模型。公式就如图所示。而当我们输入样本，最终得到的是一个数，也就是我们所谓的预测结果y_hat。（它是监督学习，所以使用的数据集都是有数据标签y的）。但如果到此为止，我们就无法对模型进行修改，迭代。静态的
2024-11-2911.29
实验四：SMO算法实现与测试一、实验目的深入理解支持向量机（SVM）的算法原理，能够使用Python语言实现支持向量机的训练与测试，并且使用五折交叉验证算法进行模型训练与评估。二、实验内容（1）从scikit-learn库中加载iris数据集，使用留出法留出1/3的样本作为测试集（注
2024-11-29Navicat-navicat15连接PG15数据库报错“字段“datlastsysoid“不存在LINE 1: SELECT DISTINCT datlastsysoid FROM pg datab
报错信息：错误:字段“datlastsysoid“不存在LINE1:SELECTDISTINCTdatlastsysoidFROMpgdatabase根因：Postgres15从pg_database表中删除了datlastsysoid字段引发此错误。解决方案：修改libcc.dll文件1、用在线工具hexed.it打开libcc.dll文件地址：https://hexed.it/如
2024-11-241
高级语言程序设计第八次个人作业这个作业属于哪个课程：https://edu.cnblogs.com/campus/fzu/2024C这个作业要求在哪里：https://edu.cnblogs.com/campus/fzu/2024C/homework/13307学号：102400103姓名：李润君1还行2和第一题类似，但多了一些条件3要对特殊情况分类讨论，上网搜了
2024-09-03Datawhale X 李宏毅苹果书 AI夏令营 Task3-机器学习实践方法论
在上一章介绍完机器学习模型后，我们接着讨论模型中可能存在的一些问题。首先我们需要明确一件事，就是Kaggle上的测试结果不好，可能有多个原因。第一，如果模型在运行训练模型时，所产生的损失就很大，那么有可能是模型偏差(modelbias)或优化(optimization)问题。第二，如果模型在运行训
2024-09-03【论文】OmniVec2:一种基于Transformer的新型大规模网络多模态多任务学习
前言《OmniVec2：ANovelTransformerbasedNetworkforLargeScaleMultimodalandMultitaskLearning》研究背景研究问题：这篇文章提出了一种新的多模态多任务网络及其相关的训练算法，旨在处理来自约12种不同模态的数据，包括图像、视频、音频、文本、深度、点云、时间序列、表格、图
2024-08-07PLEK升级了：PLEKv2工具在RNA序列分析中的卓越表现
摘要：使用PLEKv2识别鉴定lncRNA，只需要输入RNA的序列（fa文件）即可。在生物信息学领域，长非编码RNA（lncRNA）和信使RNA（mRNA）的准确区分对于理解基因调控机制至关重要。随着深度学习技术的兴起，我们迎来了PLEKv2——PLEK工具的全新升级版，它在RNA序列分类精度方面取得了显著提高。这里探
2024-08-03【机器学习】过拟合和欠拟合、高偏差（High Bias）和高方差（High Variance）的区别、过拟合和欠拟合的示例以及图表表示
引言在机器学习中，过拟合（Overfitting）是指模型在训练数据上学习得太好，以至于它捕捉到了数据中的噪声和随机波动，而不是潜在的真实关系，这导致模型在新的、未见过的数据上表现不佳；欠拟合（Underfitting）是指模型在训练数据上未能捕捉到足够的信息或模式，导致模型在训练集和测试集上
2024-07-30Bias（偏差）、Variance（方差）
偏差：是指一个模型的在不同训练集上的平均性能和最优模型的差异。偏差可以用来衡量一个模型的拟合能力。偏差越大，预测值平均性能越偏离最优模型。偏差衡量模型的预测能力，对象是一个在不同训练集上模型，形容这个模型平均性能对最优模型的预测能力。方差：（variance）描述的是一个模型在
2024-07-11机器学习策略篇：详解数据分布不匹配时，偏差与方差的分析（Bias and Variance with mismatched data distributions）
详解数据分布不匹配时，偏差与方差的分析估计学习算法的偏差和方差真的可以帮确定接下来应该优先做的方向，但是，当训练集来自和开发集、测试集不同分布时，分析偏差和方差的方式可能不一样，来看为什么。继续用猫分类器为例，说人类在这个任务上能做到几乎完美，所以贝叶斯错误率或者说贝叶
2024-07-06基于深度学习的软件漏洞检测模型在现实数据集上的表现
软件漏洞对日常软件系统的影响令人担忧。尽管已经提出了基于深度学习模型的漏洞检测方法，但这些模型的可靠性仍然是一个重大问题。先前的评估报告这些模型具有高达99%的召回率/F1分数，但研究发现，这些模型在实际应用场景下的表现并不佳，特别是在评估整个代码库而不仅仅
2024-06-22第四章分类问题
目录第五题线性判别分析(LDA)概述假设公式优点缺点二次判别分析(QDA)概述假设公式优点缺点比较第六题编辑编辑第八题逻辑回归1-最近邻比较与结论第九题第十二题第五题LDA（线性判别分析）和QDA（二次判别分析）是两种常用的分类算法，它们在统计学
2024-06-19[模式识别复习笔记] 第1-2章基本概念
1.模式识别系统的各个设计环节模式采集：借助物理设备（传感器、摄像头）进行数据的采集和存储。预处理：数据清洗、降噪，增强数据中有用的信息。特征提取：提取数据中对识别有用的特征。分类器学习：根据训练数据特点，选择何时的分类器模型，利用训练集学习得到参数。2.模式
2024-06-02kaggle竞赛实战6——方案优化之交叉验证
特征选择一共有两种方法：filter和wrapper，前者根据指标（如相关系数），后者通过模型（如随机森林）筛选超参数搜索也有三种方法——网格搜索和TPE搜索、贝叶斯优化器搜索等，后两者可以进行一定程度的先验计算，并在实际搜索中不断调整先验判断。在完成上述过程后，还要用交叉验证来看超参数选
2024-04-15人工智能大模型的训练阶段和使用方式来分类
是的，人工智能大模型也可以根据它们的训练阶段和使用方式来分类。以下是根据模型的阶段性来区分的一些类别：预训练模型:这些模型在大规模数据集上进行训练，以学习通用的特征表示。预训练可以是无监督的（如使用自编码或生成对抗网络），也可以是有监督的（如在大型标注数据集上进行训练）。
2024-03-30图像分类实战：深度学习在CIFAR-10数据集上的应用
1.前言图像分类是计算机视觉领域的一个核心任务，算法能够自动识别图像中的物体或场景，并将其归类到预定义的类别中。近年来，深度学习技术的发展极大地推动了图像分类领域的进步。CIFAR-10数据集作为计算机视觉领域的一个经典小型数据集，为研究者提供了一个理想的
2024-03-28为什么SOTA网络在你的数据集上不行？来看看Imagnet结果的迁移能力研究
论文通过实验证明，ImageNet上的模型并不总能泛化到其他数据集中，甚至可能是相反的，而模型的深度和宽度也会影响迁移的效果。如果需要参考，可选择类别数与当前任务相似的数据集上的模型性能。论文通过大量的实验来验证猜想，虽然没有研究出如通过数据集间的某些特性来直接判断模型