NORM

2025-01-23详解三种常用标准化：Batch Norm、Layer Norm和RMSNorm
在深度学习中，标准化技术是提升模型训练速度、稳定性和性能的重要手段。本文将详细介绍三种常用的标准化方法：BatchNormalization（批量标准化）、LayerNormalization（层标准化）和RMSNormalization（RMS标准化），并对其原理、实现和应用场景进行深入分析。一、BatchNormalization1.1Bat
2025-01-07(即插即用模块-Attention部分) 三十六、(2023) DCA 二重交叉注意力
文章目录1、DualCross-Attention2、代码实现paper：DualCross-AttentionforMedicalImageSegmentationCode：https://github.com/gorkemcanates/Dual-Cross-Attention1、DualCross-AttentionU-Net及其变体尽管在医学图像分割任务中取得了良好的性能，但仍然存
2024-12-23scipy.stats.norm.rvs函数
在scipy.stats模块中，norm.rvs函数用于从正态分布（高斯分布）中生成随机样本。它是SciPy提供的一个非常常用的概率分布采样工具，适合模拟正态分布的随机变量。1.函数定义scipy.stats.norm.rvs(loc=0,scale=1,size=1,random_state=None)参数说明loc：均值
2024-12-18深度学习基础理论————"优化"方法(归一化/dropout)
深度学习基础理论————"优化"方法(归一化/dropout)1、归一化方法（LayerNorm/BatchNorm/GroupNorm）归一化层是深度神经网络体系结构中的关键，在训练过程中确保各层的输入分布一致，这对于高效和稳定的学习至关重要。归一化技术的选择（Batch,Layer,GroupNormalization）会显著影响训
2024-12-15余弦相似度Cosine Sim
what余弦相似度是一种用于度量向量相似性的metric。\[cos\theta=\frac{A.B}{|A|.|B|}\]A.B：向量的内积|A|：向量的模长$cos\theta$：的范围$[-1,1]$why余弦相似度的计算复杂度很低，对于稀疏向量而言，只用考虑非零向量Hownumpy实现importnumpyasnpdefcosine_s
2024-11-27计算机基础--硬件网络（快速学习版）
计算机硬件网络1.pc组成结构电脑由主板，CPU处理器，内存RAM，硬盘，显卡组成主板：相当于人的骨架、血管CPU：CPU相当于人的大脑，因为全部都是由它思考并处理内存：当脑启动后，程序在内存中运行。当脑关闭后，内存中的程序和数据就会消失硬盘：内存中运行的程序和数据来自硬盘，硬盘用于存
2024-09-25范数--矩阵论
以下分别列举常用的向量范数和矩阵范数的定义。向量范数1-范数：||x||1=∑i=1N|xi|，即向量元素绝对值之和，matlab调用函数norm(x,1)。2-范数：||x||2=∑i=1Nxi2，Euclid范数（欧几里得范数，常用计算向量长度），即向量元素绝对值的平方和再开方，matlab调用函数norm(x,2)。∞-范数：||x||
2024-09-20大模型面试必备：100 道精选八股文题目及其详解
前言算法暑期实习机会快结束了，校招大考即将来袭。当前就业环境已不再是那个双向奔赴时代了。求职者在变多，岗位在变少，要求还更高了。最近，我们陆续整理了很多大厂的面试题，帮助球友解惑答疑和职业规划，分享了面试中的那些弯弯绕绕。分享100道大模型面试八股文，喜欢记得点赞
2024-08-28Day09_0.1基础学习MATLAB学习小技巧总结（9）——数组运算
利用空闲时间把碎片化的MATLAB知识重新系统的学习一遍，为了在这个过程中加深印象，也为了能够有所足迹，我会把自己的学习总结发在专栏中，以便学习交流。素材来源“数学建模清风”特此说明：本博客的内容只在于总结在使用matlab中的一些小技巧，并非教程，若想系统的学习MATLAB，也可以移步
2024-08-15大模型面试题库精华：100道经典问题解析
↓推荐关注↓算法暑期实习机会快结束了，校招大考即将来袭。当前就业环境已不再是那个双向奔赴时代了。求职者在变多，岗位在变少，要求还更高了。最近，我们陆续整理了很多大厂的面试题，帮助网友解惑答疑和职业规划，分享了面试中的那些弯弯绕绕。喜欢本文记得收藏、关注、点赞，更
2024-08-07线性方程组迭代算法的Python实现
更多精彩，关注博客园主页，不断学习！不断进步！我的主页csdn很少看私信，有事请b站私信博客园主页-发文字笔记-常用有限元鹰的主页内容：ABAQUS数值模拟相关Python科学计算开源框架，编程学习笔记哔哩哔哩主页-发视频-常用FE-有限元鹰的个人空间内容：模拟案例网格划分游戏视频，
2024-07-29100道大模型面试八股文
算法暑期实习机会快结束了，校招大考即将来袭。当前就业环境已不再是那个双向奔赴时代了。求职者在变多，岗位在变少，要求还更高了。最近，我们陆续整理了很多大厂的面试题，帮助球友解惑答疑和职业规划，分享了面试中的那些弯弯绕绕。资料合集：你了解ReAct吗，它有什么优点？解释一
2024-07-22CS229|Ch8-9|泛化、正则化、模型选择
关键词：泛化性、过拟合、欠拟合；误差、偏差、方差及其关系；模型复杂度&偏差&方差&过拟合&欠拟合&误差之间关系泛化性generalization:performancesonunseendatatrainingdata——seentestdata——unseen过拟合overfit:predictaccuratelyontrainingdata(smalltraining
2024-07-22《昇思25天学习打卡营第24天|生成式-Pix2Pix实现图像转换》
Pix2Pix实现图像转换Pix2Pix概述Pix2Pix是基于条件生成对抗网络（cGAN,ConditionGenerativeAdversarialNetworks）实现的一种深度学习图像转换模型该网络学习从输入图像到输出图像的映射，如Isola等人在Image-to-imagetranslationwithconditionaladversarialnetwor
2024-07-19SciTech-Mathematics-Probability+Statistics-Dot products, cosine similarity, text vectors
Dotproducts,cosinesimilarity,textvectorshttps://dev.to/sayemmh/dot-products-cosine-similarity-text-vectors-2lo4SayemHoque,PostedonOct20,2022Dotproducts,cosinesimilarity,textvectorsCosinesimilarityisameasurebetweentwosingledimen
2024-07-04SMS多表面同步透镜设计
SMS多表面同步透镜设计SMS多表面同步透镜设计一、设计原理1、Snell定律的矢量形式折射定律又称Snell定律，主要包括两个方面：一是入射光线、法线和折射光线共面，二是入射角和折射角满足以下关系：\[n_1sin{\theta_1}=n_2sin{\theta_2}\]式中，$n_1$是入射光所在介质的折射率，\(
2024-07-02SMS多表面同步透镜设计
SMS多表面同步透镜设计一、设计原理1、Snell定律的矢量形式折射定律又称Snell定律，主要包括两个方面：一是入射光线、法线和折射光线共面，二是入射角和折射角满足以下关系：n1
2024-06-17AI 大模型训练中，通常会采用哪些方法？(输入篇)
某种程度来说大模型训练的核心算法就是300到400行代码，如果真正理解了并不难。下面我将带大家分析常规大模型训练有几个阶段以及在训练中一般会用到哪些方法。由上图可以看出，大模型训练主要有四个阶段：预训练、有监督微调、奖励建模、强化学习。开始的第一个阶段是预训练阶
2024-06-06autotrain学习-环境搭建、模型和数据集下载、训练全过程
autotrain学习-环境搭建、模型和数据集下载、训练全过程1.参考链接2.创建容器3.安装autotrain4.解决没有真实权值的问题(不下载真实的权值)5.下载SFT微调数据集6.下载opt-125m模型(忽略权值文件)7.下载后的目录结构8.SFT训练A.生成配置文件(使用之前下载好的模型和数据集