bbox

2024-06-07Yolov8和Yolov10的差异以及后处理实现
Yolo模型可分为4个维度的概念模型版本、数据集、模型变体（Variants）、动态/静态模型。Yolo各模型版本进展历史Yolov（2015年华盛顿大学的JosephRedmon和AliFarhadi发布）Yolov2（2016年JosephRedmon发布）Yolov3（2018年JosephRedmon发布）Yolov4（2020年AlexeyBochkovskiy发布）Yolov5（2
2024-06-06提取PAD LOCATION 坐标
hiSetBindKey("Layout""F9""smpGUIPadExtract()")procedure(smpGUIPadExtract()let(() padlayerName=hiCreateStringField( ?name`padlayerName ?prompt"LayerName" ) padlayerPpos=hiCreateStringF
2024-05-26代码解析—part 2 数据集加载MFS—CVPR2023—Implicit Identity Leakage: The Stumbling Block to Improving Deepfake
论文讲解请看：https://blog.csdn.net/JustWantToLearn/article/details/138758033代码链接：https://github.com/megvii-research/CADDM在这里，我们简要描述算法流程，着重分析模型搭建细节，以及为什么要这样搭建。part1：数据集准备，请看链接https://blog.csdn.net/JustWantToLe
2024-05-22coco数据集转voc数据集
前言在模型训练的学习中voc和coco是最常见的两种格式，并且经常需要互相转换，本篇提供coco数据集转voc数据集的方法。coco格式分析COCO的全称是CommonObjectsinCOntext，是微软团队提供的一个可以用来进行图像识别的数据集。MSCOCO数据集中的图像分为训练、验证和测试集。
2024-04-21李沐动手学习深度学习锚框部分代码解析
这里只是对代码的解析，我在写这个解析的时候并没有看后面的内容，只能大概猜一下可能是要干嘛的首先是import相关工具，这里使用pytorch%matplotlibinlineimporttorchfromd2limporttorchasd2ltorch.set_printoptions(2)#精简输出精度1.生成锚框接下来是第一个难点，这
2024-04-06数码相框-LCD显示多行文字
显示几行文字:从左显示：先描边再算出边框。居中显示：先算出边框，再确定坐标描画。从左显示第一行数据的起始位置是从(0,24)开始的。要知道第二行数据从哪里开始，我们得知道画出来的矢量字体的边框是多少：这个数据是笛卡尔坐标。测试：#include
2024-04-06数码相框-LCD显示多行文字
显示几行文字:从左显示：先描边再算出边框。居中显示：先算出边框，再确定坐标描画。从左显示第一行数据的起始位置是从(0,24)开始的。要知道第二行数据从哪里开始，我们得知道画出来的矢量字体的边框是多少：这个数据是笛卡尔坐标。测试：#include
2024-03-27FreeType Glyph Conventions 翻译(3) ——Glyph Metrics 字符图形参数
原文地址https://freetype.org/freetype2/docs/glyphs/glyphs-3.html目录基线，笔位置以及布局Baseline,pensandlayouts排版参数和包围盒Typographicmetricsandboundingboxes定位和步进BearingsandAdvances网格对齐Theeffectsofgrid-fitting文本宽度和包围盒Text
2024-03-22开源计算机视觉库OpenCV详解
OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉和机器学习软件库。OpenCV最初由Intel开发，后来支持由WillowGarage和Itseez（被Intel收购）进行的维护和更新。这个库旨在为实时的计算机视觉应用提供一个高效的、易于使用的环境，并且是用C++编写的，尽管它提供了
2024-03-08Marker 源码解析（一）
.\marker\benchmark.pyimportargparseimporttempfileimporttimefromcollectionsimportdefaultdictfromtqdmimporttqdmfrommarker.convertimportconvert_single_pdffrommarker.loggerimportconfigure_loggingfrommarker.modelsimportload_all_mo
2024-01-31YOLO
参考目录：论文：https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Redmon_You_Only_Look_CVPR_2016_paper.pdfYOLO论文解读：https://zhuanlan.zhihu.com/p/31427164fasterRCNN是two-stage的目标检测算法，即分别完成分类和回归任务。而YOLO提出将物体检测作为一
2024-01-31YOLOv2
论文：https://openaccess.thecvf.com/content_cvpr_2017/papers/Redmon_YOLO9000_Better_Faster_CVPR_2017_paper.pdf改进点讲解1：https://zhuanlan.zhihu.com/p/71179215改进点讲解2：https://blog.csdn.net/weixin_40227656/article/details/116018040协变量偏移和BatchNormaliz
2023-10-27bbb
智警杯赛前实训目录智警杯赛前实训文本情报智能化处理与分析短信涉博分类任务介绍知识点实验步骤导入数据任务解析数据转换任务解析训练与预测任务解析网络诈骗分类任务介绍知识点实验步骤数据清洗与预处理①读取数据②分词，去停用词任务解析文本向量化③.文本向量化④.划分训练测
2023-10-26hdict文件操作
create_dict(DLDataset)set_dict_tuple(DLDataset,'class_ids',[0,1,2,3])set_dict_tuple(DLDataset,'class_names',['ng_anlie','ng_innerwuran','ng_innerwuranmh','ng_outterwuran'])set_dict_tuple(
2023-09-17 MMDetection 整体构建流程(一)
训练核心组件训练部分一般包括9个核心组件，总体流程是：任何一个batch的图片先输入到backbone中进行特征提取，典型的骨干网络是ResNet输出的单尺度或者多尺度特征图输入到neck模块中进行特征融合或者增强，典型的neck是FPN上述多尺度特征最终输入到head部分，一般都会
2023-08-09基于YoloV8的人体骨架提取代码编写时遇到的问题
1、获取骨架端点的xy轴位置在最初进行编写的时候，我借鉴了网上的代码，其中出现最多的便是bboxes_keypoints=results[0].keypoints.cpu().numpy().astype('uint32')，但是实际运行时往往会报错AttributeError:'Keypoints'objecthasnoattribute'astype'.Seevalidattributes
2023-08-09基于YOLO V8的人体骨架提取
题外话：我记得没错的话，最多两年前，当时YOLO系列才出到V5，怎么现在都出到V8了啊。1、前言YOLOv8是ultralytics公司在2023年1月10号开源的YOLOv5的下一个重大更新版本，目前支持图像分类、物体检测和实例分割任务，该公司同样也是YOLOV5的提出者，本文将面对YOLOV8-pose的本地部署
2023-05-20python 检测屏幕指定区域有变化即截图
fromPILimportImageChops#$pipinstallpillowfrompyscreenshotimportgrab#$pipinstallpyscreenshotfromdatetimeimportdatetimeimporttime,sys,reim=grab(bbox=(160,180,1760,1080))a=0whileTrue:#http://effbot.org/zone/pil-comparing-imag
2023-05-17团队开发第二阶段3
今天开始将算法优化，以下是优化后代码。importcopyimporttimefromabcimportabstractmethodfromqueueimportEmptyimportcv2importnumpyasnpimporttorchfromPILimportImageFont,Image,ImageDrawfromPyQt5.QtGuiimportQPixmap,QImagefrommodels.conc
2023-04-26[重读经典论文]YOLOv1
1.前言由JosephRedmon等人2016年在论文《YouOnlyLookOnce:Unifified,Real-TimeObjectDetection》中提出的一阶段目标检测算法，核心思想是将物体检测任务视为回归问题。它通过将图像分成S×S个网格，每个网格负责预测该网格中是否存在物体以及物体的类别和位置信息。使用单
2023-03-27数据集标注格式
数据集的标注文件分为两个版本：有向目标边框（OrientedBoundingBox，OBB）与水平目标边框（HorizontalBoundingBox，HBB）。一、COCOCOCO数据集，是将所有图像的标签信息和类别信息
2023-03-23根据投影坐标(x,y)计算bbox
根据墨卡托投影坐标(x,y)计算该瓦片的对角线坐标bboximport*asolProjfrom'ol/proj';import{getTopLeft,getWidth}from'ol/extent';consttileWidth=256;
2023-02-27pytorch不定长数据的dataloader读取
参考资料：https://pytorch.org/docs/stable/data.html#dataloader-collate-fnhttps://blog.csdn.net/anshiquanshu/article/details/112868740在使用Pyt
2023-02-22matplotlib中如何将图例位置放在绘图区外
bbox_to_anchor参数可以通过bbox_to_anchor参数将图例放置在坐标系外。bbox表示容纳图例的边界框-boundingboxplt.legend(bbox_to_anchor=(x0,y0,width,height),lo
2023-02-15[经验] 使用Python解析Xml文件常用办法（xml库）
常使用python自带xml库解析xml文件，过程如下：1.使用xml.etree.ElementTree库的ET.parse()函数解析XML文件。2.遍历XML文件中的所有<object>元素，并提取每个对象的类别和