- 2024-11-21常见大模型——chatlm系列
ChatGLM背景主流的预训练框架主要有三种:1、AutoRegressive自回归模型(AR模型):代表GPT。本质上是一个Left-to-Right的语言模型。通常用于生成式任务,在长文本生成方面取得了巨大的成功。当扩展到十亿级别参数时,变现出了少样本学习能力。缺点是单向注意力机制,在NLU任务中,无法
- 2024-11-19Transformer Concept Exploration and Practice in Pytorch
IntroductionTransformer是一种广泛应用与自然语言处理的神经网络架构,它基于自注意力机制,允许模型在做出预测时为句子中的不同单词赋予不同的重要性。它非常擅长处理序列任务,并且具有并行计算的优势,因此在大规模数据集上训练时非常高效。序列任务是任何将输入序列进行变换得到输
- 2024-11-15基于特征点模型的人脸和面具拟合的方法研究
目录第一章:引言1.1研究背景1.2研究意义1.3研究目标1.4文章结构第二章:特征点模型与人脸检测2.1人脸检测的选择2.2特征点检测的实现2.3特征点的重要性第三章:面具拟合方法3.1正脸情况的仿射变换3.2正脸仿射变换的代码实现3.3仿射变换的效果分析第四章:侧脸
- 2024-11-15学习日记-2024.11.12
想使用xarm搭建一个通过视觉(yolo)进行抓取的系统.(仅供参考,自己复盘用,初学者)1,先使用xarm_ros(github)搭建自己想要的环境.准备使用xarm_gazebo中的xarm6_beside_table.launch文件(但是world选择xarm_camera_scene.aorld).我希望在xarm末端处有一个D435i摄像机.同时,在桌
- 2024-11-12LiTS 数据集预处理(一) 肝脏肿瘤图像分割
前言最近在学习Unet等家族做肝脏肿瘤分割,肝脏肿瘤公开数据集有出名的(全球人都在研究的)LITS数据集,从网上下载下来的时候,格式是nii文件。因为我是学习的2D模型训练,所以我需要对nii格式文件进行切片,经过研究学习网上几份代码,发现其中还有有点讲究的,所以想写篇文章分享介绍一
- 2024-11-1124/11/11 算法笔记<视觉> 换脸,人脸特征点检测
先介绍一下换脸的简单步骤1、提取两张图片的脸部特征点2、为两张图片创建mask3、进行映射变换使得人脸对齐4、使用opencv的泊松融合将两张图片合成我们直接上代码1.导入代码包importmediapipeasmpfrommediapipe.tasksimportpythonfrommediapipe.tasks.pythoni
- 2024-11-10【论文系列】之 ---- BERT
BERT(BidirectionalEncoderRepresentationfromTransformers)机器阅读理解领域从名字很好理解,主要使用的方法是Transformer的方法。。进行机器翻译等操作省流:BERT用于文本识别,机器阅读理解。。跟GPT类似(1)词嵌入Embedding词嵌入又有三个部分组成:TokenEmbeddingSegment
- 2024-11-05AI带货主播背景替换与虚拟场景融合的源代码!
AI带货主播作为新兴的直播形式,正在逐步改变我们的购物体验,借助先进的人工智能技术,带货主播可以在虚拟环境中进行直播,背景可以实时替换,场景也可以灵活变换。这不仅增强了直播的趣味性,也大大提升了观众的沉浸感,接下来,本文将分享一些关于AI带货主播背景替换与虚拟场景融合的源代
- 2024-11-04细嗦Transformer(三):准备训练,讲解及代码实现优化器、学习率调整策略、正则化和KL散度损失
文章目录关注我:细嗦大模型批处理对象/BatchesandMasking训练循环主函数/TrainingLoop优化器/Optimizer学习率调整策略/Learningrateadjustmentstrategy样例测试正则化/RegularizationLabelsmoothing标签平滑KL散度损失样例测试Github完整代码----求
- 2024-11-04LLM大模型: Segment Anything Model原理详解
meta在2023.4.5又发了imagesematicsegmentation的文章,名字就叫SegmentAnything;学术圈有个潜规则:title越简单,事情越大,比如7年前的那篇attentionisallyouneed,直接提升了nlp的层次!这次的SegmentAnything同样也很简单,这次又有哪些breakthroughinnovation?1、(1)论文
- 2024-11-01C++之OpenCV入门到提高003:矩阵的掩膜(Mask)处理
一、介绍今天是这个系列《C++之Opencv入门到提高》得第三篇文章。今天这篇文章也不难,主要介绍如何使用Opencv对图像进行掩膜处理,提高图像的对比度。在这个过程中,我们可以学到如何获取图像指针、如何处理像素值越界等问题。我们一步一个脚印的走,收获就会越来越多。虽然
- 2024-10-31线程绑定cpu核心的代码研究
1、使用taskset指令1)获取进程pid[root@CENTOS57eq]#psaux|grepledroot92400.00.06324376pts/0S07:400:00./ledThreadroot92420.00.0112660968pts/0S+07:400:00grep--color=autoled2)查看进程当前运行在哪个cpu
- 2024-10-30LLM大模型: Maskformer/Mask2Former语义分割原理详解
1、自动驾驶、机器人、电商、监控等行业都涉及到image的sematicsegmentation,传统的方式:per-pixelclassification,每个像素点都要分类;如果进一步做 instance-levelsegmentation,可能还要改networkarchiture后重新训练,很麻烦。FAIR在2021年10月份的时候发表了论文:Per-PixelC
- 2024-10-27Transformer 模型
Transformer是一种基于自注意力机制的深度神经网络结构,由谷歌在2017年提出,最初应用于机器翻译任务。与传统的循环神经网络(RNN)不同,Transformer摒弃了序列依赖的结构,依靠自注意力机制全局建模输入序列中的依赖关系,极大提升了并行计算效率和捕捉长程依赖的能力
- 2024-10-26supervision 检测和分割Utils Day(3)
今天学习Detections和Segmentation底下的DoubleDetectionFilter和一些列方法工具Utils一、DoubleDetectionFilter(官方文档下归的类)OverlapFilter类介绍:OverlapFilter类是一个枚举类,枚举过滤重叠的策略,主要处理一些检测框或检测膜重叠的问题属性:NONE:不根据重叠
- 2024-10-23大语言模型底层架构——Transfomer简析及实践
语言模型目标是建模自然语言的概率分布,在自然语言处理研究中具有重要的作用,是自然语言处理基础任务之一。大量的研究从n元语言模型(n-gramLanguageModels)、神经语言模型(NeuralLanguageModels,NLM)以及预训练语言模型(Pre-trainedLanguageModels,PLM)等不同角度开展了系列工
- 2024-10-23Sprite Renderer
SpriteRenderer(精灵渲染器)SpriteRenderer组件用于渲染__精灵__并控制其在2D和3D项目场景中的可视化效果。创建精灵(GameObject>2DObject>Sprite)时,Unity会自动创建一个附加了SpriteRenderer组件的游戏对象。还可以通过Components菜单(Component>Renderin
- 2024-10-22diffusers-源码解析-二十六-
diffusers源码解析(二十六).\diffusers\pipelines\deepfloyd_if\pipeline_if_inpainting_superresolution.py#导入html模块,用于处理HTML文本importhtml#导入inspect模块,用于获取对象的信息importinspect#导入re模块,用于正则表达式匹配importre#导入urllib.
- 2024-10-22OpenCV-Python 颜色空间转换
一、颜色空间转换importcv2importnumpyasnpimg=cv2.imread('lena.jpg')#转换成灰度图img_gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)cv2.imshow('img',img)cv2.imshow('gray',img_gray)cv2.waitKey(0)颜色转换其实是数学运算,如灰度化最常用的是:gray
- 2024-10-21HCI_LE_Set_Event_Mask(0x0001)命令全面解析
目录一、命令概述二、命令格式2.1.一般格式2.2.格式示例2.3.发送命令三、命令参数详解3.1. LE_Event_Mask3.2.常见事件掩码3.3.使用注意事项四、命令返回参数说明4.1.返回事件:HCI_Command_Complete4.2.返回事件参数五、命令的执行流程5.1.命令发送(主机
- 2024-10-20汽车道路分割检测数据集 道路分割 9000张 voc yolo coco 道路语义分割数据集 道路分割数据集 道路语义分割数据集 语义分割检测数据集 26类9000张
汽车道路分割检测数据集道路分割9000张vocyolococo道路语义分割数据集道路分割数据集道路语义分割数据集 语义分割检测数据集 26类9000张道路分割检测数据集类别:计算机视觉、语义分割、物体检测、智能交通系统用途:该数据集专为训练和评估用于道路场景中各种对
- 2024-10-18E-拼接串
题目:思路:在已有的数组中寻找符合条件,也就是没有重复数字的子数组,以掩码的对应位的形式来表示当前子数组元素的存在,之后双重循环生成所有子数组,内层循环中,判断当前元素是否存在掩码中,存在则推出,不存在则加入掩码并标记。用另一个循环来更新sum数组,使得每个掩码的值能反映其对应
- 2024-10-14YOLO 实战演练
下面将会自定义训练目标检测数据集注意:没有特殊说明,路径均是以项目根目录为准官方数据集首先下载权重文件并将放到ultralytics项目根目录之后测试预训练模型的效果,在根目录执行如下命令yolopredictmodel=yolov8n.ptsource=ultralytics/assets/bus.jpg之后我们
- 2024-10-12【视觉分割新SOTA】一种最先进的图像分割模型!Segment Anything Model (SAM)如何使用?附代码和解释。
【视觉分割新SOTA】一种最先进的图像分割模型!SegmentAnythingModel(SAM)如何使用?附代码和解释。【视觉分割新SOTA】一种最先进的图像分割模型!SegmentAnythingModel(SAM)如何使用?附代码和解释。文章目录【视觉分割新SOTA】一种最先进的图像分割模型!SegmentAnyth