• 2025-01-01General ML interview questions
    QuestionsHowtocombatwithoverfittingDifferencebetweenRandomForestandXGBoostHowtohandlemissingvalue?Howtotrainaregressiontree?DifferencebetweenGradientDescent(GD)andStochasticGradientDescent(SGD)MoreVariantsofSGDNon-differ
  • 2024-12-10.bss和.data段
    .bss段(BlockStartedbySymbol)存储内容:.bss段用于存储未初始化的全局变量和静态变量。这些变量在编译时没有被赋予具体的初始值。初始化:.bss段中的变量在程序加载到内存时,由操作系统自动初始化为零(或NULL)。这是因为在大多数情况下,未初始化的数据内存区域会被清零。大
  • 2024-04-05河南大学-机器学习-朴素贝叶斯分类
    实验目的掌握决策树算法原理;   2.编程实现朴素贝叶斯算法算法,并实现分类任务实验内容1.使用sklearn的朴素贝叶斯算法对鸢尾花数据集进行分类,要求:(1)划分训练集和测试集(测试集占20%)(2)对测试集的预测类别标签和真实标签进行对比(3)输出分类的准确率2.动手编写朴素
  • 2024-03-26决策树学习-计算数据集的信息熵
    #计算信息熵defcalEntro(dataset):dataset=np.array(dataset)data_len=len(dataset)#labelCount记录各类样本数据的数量labelCount={}forrowindataset:cur_label=row[-1]ifcur_labelnotinlabelCount.keys():
  • 2024-03-22Python 机器学习 维特比算法和鲍姆-韦尔奇算法
    在机器学习和信号处理领域,特别是在处理隐马尔可夫模型(HiddenMarkovModels,HMM)时,维特比算法(ViterbiAlgorithm)和鲍姆-韦尔奇算法(Baum-WelchAlgorithm)是两个核心算法,用于不同的目的。维特比算法用于解决解码问题,即在给定观察序列的情况下找到最可能的状态序列。它通过动态规
  • 2024-02-28duel prob/duel chall 随记
    CF1404C\(2300\)。离线,数据结构。区区\(2k3\),居然想了这么久,没救了。类别为/duelprob。可以先离线,\(r\)端点从小到大排序。并且\(a_i=i-a_i\),这样,若\(a_i<0\),永远不能删掉。在\(l\in[1,n]\)都不行。如果\(a_i\geq0\)时,前面不能删多少它才不能删呢?有\(i
  • 2024-02-18模板默写
    别到时候题会做了板子不会写……数据结构主席树ProbFHQTreap可持久化FHQTreap图论支配树Prob上下界最大/最小流带负圈的费用流数学万能欧几里德杜教筛字符串ACAMSASAMGSAM……
  • 2023-12-28体育模拟竞技
    模拟乒乓球比赛importrandom#引用random库defsportgame():print("Welcometothesportgame")print("这个程序将模拟乒乓球比赛")#介绍程序defInputPlayer():player1=eval(input("请输入运动员A能力值:"))player2=eval(input("请输入运动员B能力
  • 2023-12-27自然语言处理与大数据:如何实现数据的可视化与交互性
    1.背景介绍自然语言处理(NLP)是人工智能领域的一个重要分支,它涉及计算机对自然语言的理解和生成。随着数据的大量产生,自然语言处理与大数据技术的结合成为了一个热门的研究方向。在这篇文章中,我们将探讨如何实现数据的可视化与交互性,以便更好地理解和应用自然语言处理技术。1.1自然
  • 2023-12-26神经网络优化篇:如何理解 dropout(Understanding Dropout)
    理解dropoutDropout可以随机删除网络中的神经单元,为什么可以通过正则化发挥如此大的作用呢?直观上理解:不要依赖于任何一个特征,因为该单元的输入可能随时被清除,因此该单元通过这种方式传播下去,并为单元的四个输入增加一点权重,通过传播所有权重,dropout将产生收缩权重的平方范数的
  • 2023-12-21t-SNE完整笔记 (附Python代码)
    t-SNE(t-distributedstochasticneighborembedding)是用于降维的一种机器学习算法,是由LaurensvanderMaaten和GeoffreyHinton在08年提出来。此外,t-SNE是一种非线性降维算法,非常适用于高维数据降维到2维或者3维,进行可视化。t-SNE是由SNE(StochasticNeighborEmbedding,SN
  • 2023-12-14综合设计——多源异构数据采集与融合应用综合实践
    综合设计——多源异构数据采集与融合应用综合实践​这个项目属于哪个课程2023数据采集与融合技术组名、项目简介组名:普雷蒙奇、项目需求:多模态情感分析、项目目标:通过在网页中搜索关键词来得到一个综合的情感分析、项目开展技术路线:前端、python、华为云平台、Django
  • 2023-11-27线性规划——Pyhton线性规划求解库PULP的使用
    PuLP是一个用于线性规划(LP)、整数线性规划(ILP)和混合整数线性规划(MILP)问题的Python库。PuLP的全称是"PythonforMathematicalProgramming",它提供了一个简单而强大的工具,使得用户能够定义优化问题、构建数学模型并使用不同的求解器进行求解。PuLP的主要特点之一是其易用性。它允许
  • 2023-09-20HNU个人项目互评
    一、前言这篇博客是对软件工程导论的个人项目进行互评,项目要求实现一个简单的中小学数学卷子自动生成程序。我的搭档谢先衍同学使用Python完成了项目,而我则是使用java。尽管语言不同增加了一定的阅读成本,但是接触到另一种新语言并体会编程者发挥语言特性独特的心得,确实是拓展了
  • 2023-08-15校准-calibration
    保序回归保序回归其实是reliabilitydiagram回归的自动版,即自动选择分桶的边界。如下图:从mse的角度来说,loss会比OLS大,但是保证了不改变模型的排序能力。个人认为,对于contrastiveloss或者是crossentropyloss,都会由于优化目标与p(y|x)的真实值有区别。如果选模型用的是auc的话
  • 2023-08-09基于Pair-wise和CrossEncoder训练单塔模型
    本文分享自华为云社区《语义检索系统排序模块:基于ERNIE-Gram的Pair-wise和基于RocketQA的CrossEncoder训练单塔模型》,作者:汀丶。文本匹配任务数据每一个样本通常由两个文本组成(query,title)。类别形式为0或1,0表示query与title不匹配;1表示匹配。基于单塔Point-wise范
  • 2023-08-09基于RocketQA的CrossEncoder训练单塔模型
    本文分享自华为云社区《语义检索系统排序模块:基于ERNIE-Gram的Pair-wise和基于RocketQA的CrossEncoder训练单塔模型》,作者:汀丶。 文本匹配任务数据每一个样本通常由两个文本组成(query,title)。类别形式为0或1,0表示query与title不匹配;1表示匹配。基于单塔Point-wise范式
  • 2023-08-03强化学习——策略梯度之Reinforce
    1、策略梯度介绍相比与DQN,策略梯度方法的区别主要在于,我们对于在某个状态下所采取的动作,并不由一个神经网络来决定,而是由一个策略函数来给出,而这个策略函数的目的,就是使得最终的奖励的累加和最大,这也是训练目标,所以训练会围绕策略函数的梯度来进行。2、策略函数以Reinforce算法
  • 2023-08-02语义检索系统之排序模块:基于ERNIE-Gram的Pair-wise和基于RocketQA的CrossEncoder训练的单塔模型
    语义检索系统之排序模块:基于ERNIE-Gram的Pair-wise和基于RocketQA的CrossEncoder训练的单塔模型文本匹配任务数据每一个样本通常由两个文本组成(query,title)。类别形式为0或1,0表示query与title不匹配;1表示匹配。基于单塔Point-wise范式的语义匹配模型ernie_matchi
  • 2023-07-13SimpleITK 读写nii.gz文件
    1、读写nii.gz文件1##usingsimpleITKtoloadandsavedata.2importSimpleITKassitk3itk_img=sitk.ReadImage('./nifti.nii.gz')4img=sitk.GetArrayFromImage(itk_img)5print("imgshape:",img.shape)67##save8out=si
  • 2023-07-13SimpleITK 三维图像分析
    1、去除3D小连通域在一些计算机视觉任务中,需要对模型的输出做一些后处理以优化视觉效果,连通域就是一种常见的后处理方式。尤其对于分割任务,有时的输出mask会存在一些假阳(小的无用轮廓),通过3D连通域找出面积较小的独立轮廓并去除可以有效地提升视觉效果。二维图像连通域一
  • 2023-05-27基于GoogleNet深度学习网络的人员身份识别系统Matlab仿真
    1.算法仿真效果matlab2022a仿真结果如下:  2.算法涉及理论知识概要       深度学习(DL,DeepLearning)是机器学习(ML,MachineLearning)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能(AI,ArtificialIntelligence)。[1深度学习是学习样本数据