mask

2024-11-21常见大模型——chatlm系列
ChatGLM背景主流的预训练框架主要有三种：1、AutoRegressive自回归模型（AR模型）：代表GPT。本质上是一个Left-to-Right的语言模型。通常用于生成式任务，在长文本生成方面取得了巨大的成功。当扩展到十亿级别参数时，变现出了少样本学习能力。缺点是单向注意力机制，在NLU任务中，无法
2024-11-19Transformer Concept Exploration and Practice in Pytorch
IntroductionTransformer是一种广泛应用与自然语言处理的神经网络架构，它基于自注意力机制，允许模型在做出预测时为句子中的不同单词赋予不同的重要性。它非常擅长处理序列任务，并且具有并行计算的优势，因此在大规模数据集上训练时非常高效。序列任务是任何将输入序列进行变换得到输
2024-11-15基于特征点模型的人脸和面具拟合的方法研究
目录第一章：引言1.1研究背景1.2研究意义1.3研究目标1.4文章结构第二章：特征点模型与人脸检测2.1人脸检测的选择2.2特征点检测的实现2.3特征点的重要性第三章：面具拟合方法3.1正脸情况的仿射变换3.2正脸仿射变换的代码实现3.3仿射变换的效果分析第四章：侧脸
2024-11-15学习日记-2024.11.12
想使用xarm搭建一个通过视觉(yolo)进行抓取的系统.(仅供参考,自己复盘用,初学者)1,先使用xarm_ros(github)搭建自己想要的环境.准备使用xarm_gazebo中的xarm6_beside_table.launch文件(但是world选择xarm_camera_scene.aorld).我希望在xarm末端处有一个D435i摄像机.同时,在桌
2024-11-12LiTS 数据集预处理（一）肝脏肿瘤图像分割
前言最近在学习Unet等家族做肝脏肿瘤分割，肝脏肿瘤公开数据集有出名的（全球人都在研究的）LITS数据集，从网上下载下来的时候，格式是nii文件。因为我是学习的2D模型训练，所以我需要对nii格式文件进行切片，经过研究学习网上几份代码，发现其中还有有点讲究的，所以想写篇文章分享介绍一
2024-11-1124/11/11 算法笔记＜视觉＞换脸，人脸特征点检测
先介绍一下换脸的简单步骤1、提取两张图片的脸部特征点2、为两张图片创建mask3、进行映射变换使得人脸对齐4、使用opencv的泊松融合将两张图片合成我们直接上代码1.导入代码包importmediapipeasmpfrommediapipe.tasksimportpythonfrommediapipe.tasks.pythoni
2024-11-10【论文系列】之 ---- BERT
BERT（BidirectionalEncoderRepresentationfromTransformers）机器阅读理解领域从名字很好理解，主要使用的方法是Transformer的方法。。进行机器翻译等操作省流：BERT用于文本识别，机器阅读理解。。跟GPT类似（1）词嵌入Embedding词嵌入又有三个部分组成：TokenEmbeddingSegment
2024-11-05AI带货主播背景替换与虚拟场景融合的源代码!
AI带货主播作为新兴的直播形式，正在逐步改变我们的购物体验，借助先进的人工智能技术，带货主播可以在虚拟环境中进行直播，背景可以实时替换，场景也可以灵活变换。这不仅增强了直播的趣味性，也大大提升了观众的沉浸感，接下来，本文将分享一些关于AI带货主播背景替换与虚拟场景融合的源代
2024-11-04细嗦Transformer（三）：准备训练，讲解及代码实现优化器、学习率调整策略、正则化和KL散度损失
文章目录关注我：细嗦大模型批处理对象/BatchesandMasking训练循环主函数/TrainingLoop优化器/Optimizer学习率调整策略/Learningrateadjustmentstrategy样例测试正则化/RegularizationLabelsmoothing标签平滑KL散度损失样例测试Github完整代码----求
2024-11-04LLM大模型: Segment Anything Model原理详解
meta在2023.4.5又发了imagesematicsegmentation的文章，名字就叫SegmentAnything；学术圈有个潜规则：title越简单，事情越大，比如7年前的那篇attentionisallyouneed，直接提升了nlp的层次！这次的SegmentAnything同样也很简单，这次又有哪些breakthroughinnovation？1、（1）论文
2024-11-01C++之OpenCV入门到提高003：矩阵的掩膜（Mask）处理
一、介绍今天是这个系列《C++之Opencv入门到提高》得第三篇文章。今天这篇文章也不难，主要介绍如何使用Opencv对图像进行掩膜处理，提高图像的对比度。在这个过程中，我们可以学到如何获取图像指针、如何处理像素值越界等问题。我们一步一个脚印的走，收获就会越来越多。虽然
2024-10-31线程绑定cpu核心的代码研究
1、使用taskset指令1）获取进程pid[root@CENTOS57eq]#psaux|grepledroot92400.00.06324376pts/0S07:400:00./ledThreadroot92420.00.0112660968pts/0S+07:400:00grep--color=autoled2）查看进程当前运行在哪个cpu
2024-10-30LLM大模型: Maskformer/Mask2Former语义分割原理详解
1、自动驾驶、机器人、电商、监控等行业都涉及到image的sematicsegmentation，传统的方式：per-pixelclassification，每个像素点都要分类；如果进一步做 instance-levelsegmentation，可能还要改networkarchiture后重新训练，很麻烦。FAIR在2021年10月份的时候发表了论文：Per-PixelC
2024-10-27Transformer 模型
Transformer是一种基于自注意力机制的深度神经网络结构，由谷歌在2017年提出，最初应用于机器翻译任务。与传统的循环神经网络（RNN）不同，Transformer摒弃了序列依赖的结构，依靠自注意力机制全局建模输入序列中的依赖关系，极大提升了并行计算效率和捕捉长程依赖的能力
2024-10-26supervision 检测和分割Utils Day(3)
今天学习Detections和Segmentation底下的DoubleDetectionFilter和一些列方法工具Utils一、DoubleDetectionFilter（官方文档下归的类）OverlapFilter类介绍：OverlapFilter类是一个枚举类，枚举过滤重叠的策略，主要处理一些检测框或检测膜重叠的问题属性：NONE：不根据重叠
2024-10-23大语言模型底层架构——Transfomer简析及实践
语言模型目标是建模自然语言的概率分布，在自然语言处理研究中具有重要的作用，是自然语言处理基础任务之一。大量的研究从n元语言模型（n-gramLanguageModels）、神经语言模型（NeuralLanguageModels，NLM）以及预训练语言模型（Pre-trainedLanguageModels，PLM）等不同角度开展了系列工
2024-10-23Sprite Renderer
SpriteRenderer（精灵渲染器）SpriteRenderer组件用于渲染__精灵__并控制其在2D和3D项目场景中的可视化效果。创建精灵(GameObject>2DObject>Sprite)时，Unity会自动创建一个附加了SpriteRenderer组件的游戏对象。还可以通过Components菜单(Component>Renderin
2024-10-22diffusers-源码解析-二十六-
diffusers源码解析（二十六）.\diffusers\pipelines\deepfloyd_if\pipeline_if_inpainting_superresolution.py#导入html模块，用于处理HTML文本importhtml#导入inspect模块，用于获取对象的信息importinspect#导入re模块，用于正则表达式匹配importre#导入urllib.
2024-10-22OpenCV-Python 颜色空间转换
一、颜色空间转换importcv2importnumpyasnpimg=cv2.imread('lena.jpg')#转换成灰度图img_gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)cv2.imshow('img',img)cv2.imshow('gray',img_gray)cv2.waitKey(0)颜色转换其实是数学运算，如灰度化最常用的是：gray
2024-10-21HCI_LE_Set_Event_Mask(0x0001)命令全面解析
目录一、命令概述二、命令格式2.1.一般格式2.2.格式示例2.3.发送命令三、命令参数详解3.1. LE_Event_Mask3.2.常见事件掩码3.3.使用注意事项四、命令返回参数说明4.1.返回事件：HCI_Command_Complete4.2.返回事件参数五、命令的执行流程5.1.命令发送（主机
2024-10-20汽车道路分割检测数据集道路分割 9000张 voc yolo coco 道路语义分割数据集道路分割数据集道路语义分割数据集语义分割检测数据集 26类9000张
汽车道路分割检测数据集道路分割9000张vocyolococo道路语义分割数据集道路分割数据集道路语义分割数据集语义分割检测数据集 26类9000张道路分割检测数据集类别：计算机视觉、语义分割、物体检测、智能交通系统用途：该数据集专为训练和评估用于道路场景中各种对
2024-10-18E-拼接串
题目：思路：在已有的数组中寻找符合条件，也就是没有重复数字的子数组，以掩码的对应位的形式来表示当前子数组元素的存在，之后双重循环生成所有子数组，内层循环中，判断当前元素是否存在掩码中，存在则推出，不存在则加入掩码并标记。用另一个循环来更新sum数组，使得每个掩码的值能反映其对应
2024-10-14YOLO 实战演练
下面将会自定义训练目标检测数据集注意：没有特殊说明，路径均是以项目根目录为准官方数据集首先下载权重文件并将放到ultralytics项目根目录之后测试预训练模型的效果，在根目录执行如下命令yolopredictmodel=yolov8n.ptsource=ultralytics/assets/bus.jpg之后我们
2024-10-12【视觉分割新SOTA】一种最先进的图像分割模型！Segment Anything Model (SAM)如何使用？附代码和解释。
【视觉分割新SOTA】一种最先进的图像分割模型！SegmentAnythingModel(SAM)如何使用？附代码和解释。【视觉分割新SOTA】一种最先进的图像分割模型！SegmentAnythingModel(SAM)如何使用？附代码和解释。文章目录【视觉分割新SOTA】一种最先进的图像分割模型！SegmentAnyth