BBOX

2024-10-22YOLOv1目标检测
目标检测ObjectDetection文章目录目标检测ObjectDetection前言YOLOv1思想检测策略实现过程YOLOv1的损失函数公式YOLOv1的优缺点优点：局限：核心代码结构损失函数计算iou计算NMS前言在YOLOv1(2016)提出之前，R-CNN系列算法在目标检测领域独占鳌头。R-CNN系列
2024-10-16GDSFactory dbbox() and bbox() 用法
GDSFactorydbboxandbbox用法引言正文引言今天遇到一个问题，本人发现GDSFactory中获取box对象的边界点时可以使用dbbox()，也可以使用bbox()函数。于是对这两个函数进行了探索，发现了它们之间的微小差异，这里特来记录一下。正文首先，我们可以采用如下代码生
2024-08-29训练yolov5时出现报错：AttributeError: ‘FreeTypeFont‘ object has no attribute ‘getsize‘
报错：Traceback(mostrecentcalllast):File"D:\anaconda3_xz\envs\luopytorch\lib\threading.py",line932,in_bootstrap_innerself.run()File"D:\anaconda3_xz\envs\luopytorch\lib\threading.py",line870,inrunself._target(*s
2024-08-2728-目标检测
importtorchimportmatplotlib.pyplotaspltfromsympy.physics.control.control_plotsimportmatplotlibfromd2limporttorchasd2l#plt.figure(figsize=(3.5,2.5))img=d2l.plt.imread('./image/catdog.jpg')#plt.imshow(img)#plt.show()de
2024-07-27ComfyUI插件：ComfyUI Impact 节点（一）
前言：学习ComfyUI是一场持久战，而ComfyUIImpact是一个庞大的模块节点库，内置许多非常实用且强大的功能节点，例如检测器、细节强化器、预览桥、通配符、Hook、图片发送器、图片接收器等等。通过这些节点的组合运用，我们可以实现的工作有很多，例如自动人脸检测和优化修复、区域增强、
2024-07-27ComfyUI插件：ComfyUI Impact 节点（一）
前言：学习ComfyUI是一场持久战，而ComfyUIImpact是一个庞大的模块节点库，内置许多非常实用且强大的功能节点，例如检测器、细节强化器、预览桥、通配符、Hook、图片发送器、图片接收器等等。通过这些节点的组合运用，我们可以实现的工作有很多，例如自动人脸检测和优化修复、区域增
2024-07-19paddleocr识别并按行输出结果
frompaddleocrimportPaddleOCR#初始化OCR引擎ocr=PaddleOCR(use_angle_cls=True,lang="ch")#使用中文模型#对图像进行OCR识别img_path='./imgs/img_3.png'result=ocr.ocr(img_path,cls=True)#按y坐标对文本块进行排序sorted_result=sorted(result,
2024-06-07Yolov8和Yolov10的差异以及后处理实现
Yolo模型可分为4个维度的概念模型版本、数据集、模型变体（Variants）、动态/静态模型。Yolo各模型版本进展历史Yolov（2015年华盛顿大学的JosephRedmon和AliFarhadi发布）Yolov2（2016年JosephRedmon发布）Yolov3（2018年JosephRedmon发布）Yolov4（2020年AlexeyBochkovskiy发布）Yolov5（2
2024-06-06提取PAD LOCATION 坐标
hiSetBindKey("Layout""F9""smpGUIPadExtract()")procedure(smpGUIPadExtract()let(() padlayerName=hiCreateStringField( ?name`padlayerName ?prompt"LayerName" ) padlayerPpos=hiCreateStringF
2024-05-26代码解析—part 2 数据集加载MFS—CVPR2023—Implicit Identity Leakage: The Stumbling Block to Improving Deepfake
论文讲解请看：https://blog.csdn.net/JustWantToLearn/article/details/138758033代码链接：https://github.com/megvii-research/CADDM在这里，我们简要描述算法流程，着重分析模型搭建细节，以及为什么要这样搭建。part1：数据集准备，请看链接https://blog.csdn.net/JustWantToLe
2024-05-22coco数据集转voc数据集
前言在模型训练的学习中voc和coco是最常见的两种格式，并且经常需要互相转换，本篇提供coco数据集转voc数据集的方法。coco格式分析COCO的全称是CommonObjectsinCOntext，是微软团队提供的一个可以用来进行图像识别的数据集。MSCOCO数据集中的图像分为训练、验证和测试集。
2024-04-21李沐动手学习深度学习锚框部分代码解析
这里只是对代码的解析，我在写这个解析的时候并没有看后面的内容，只能大概猜一下可能是要干嘛的首先是import相关工具，这里使用pytorch%matplotlibinlineimporttorchfromd2limporttorchasd2ltorch.set_printoptions(2)#精简输出精度1.生成锚框接下来是第一个难点，这
2024-04-06数码相框-LCD显示多行文字
显示几行文字:从左显示：先描边再算出边框。居中显示：先算出边框，再确定坐标描画。从左显示第一行数据的起始位置是从(0,24)开始的。要知道第二行数据从哪里开始，我们得知道画出来的矢量字体的边框是多少：这个数据是笛卡尔坐标。测试：#include
2024-04-06数码相框-LCD显示多行文字
显示几行文字:从左显示：先描边再算出边框。居中显示：先算出边框，再确定坐标描画。从左显示第一行数据的起始位置是从(0,24)开始的。要知道第二行数据从哪里开始，我们得知道画出来的矢量字体的边框是多少：这个数据是笛卡尔坐标。测试：#include
2024-03-27FreeType Glyph Conventions 翻译(3) ——Glyph Metrics 字符图形参数
原文地址https://freetype.org/freetype2/docs/glyphs/glyphs-3.html目录基线，笔位置以及布局Baseline,pensandlayouts排版参数和包围盒Typographicmetricsandboundingboxes定位和步进BearingsandAdvances网格对齐Theeffectsofgrid-fitting文本宽度和包围盒Text
2024-03-22开源计算机视觉库OpenCV详解
OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉和机器学习软件库。OpenCV最初由Intel开发，后来支持由WillowGarage和Itseez（被Intel收购）进行的维护和更新。这个库旨在为实时的计算机视觉应用提供一个高效的、易于使用的环境，并且是用C++编写的，尽管它提供了
2024-03-08Marker 源码解析（一）
.\marker\benchmark.pyimportargparseimporttempfileimporttimefromcollectionsimportdefaultdictfromtqdmimporttqdmfrommarker.convertimportconvert_single_pdffrommarker.loggerimportconfigure_loggingfrommarker.modelsimportload_all_mo
2024-01-31YOLO
参考目录：论文：https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Redmon_You_Only_Look_CVPR_2016_paper.pdfYOLO论文解读：https://zhuanlan.zhihu.com/p/31427164fasterRCNN是two-stage的目标检测算法，即分别完成分类和回归任务。而YOLO提出将物体检测作为一
2024-01-31YOLOv2
论文：https://openaccess.thecvf.com/content_cvpr_2017/papers/Redmon_YOLO9000_Better_Faster_CVPR_2017_paper.pdf改进点讲解1：https://zhuanlan.zhihu.com/p/71179215改进点讲解2：https://blog.csdn.net/weixin_40227656/article/details/116018040协变量偏移和BatchNormaliz
2023-10-27bbb
智警杯赛前实训目录智警杯赛前实训文本情报智能化处理与分析短信涉博分类任务介绍知识点实验步骤导入数据任务解析数据转换任务解析训练与预测任务解析网络诈骗分类任务介绍知识点实验步骤数据清洗与预处理①读取数据②分词，去停用词任务解析文本向量化③.文本向量化④.划分训练测
2023-10-26hdict文件操作
create_dict(DLDataset)set_dict_tuple(DLDataset,'class_ids',[0,1,2,3])set_dict_tuple(DLDataset,'class_names',['ng_anlie','ng_innerwuran','ng_innerwuranmh','ng_outterwuran'])set_dict_tuple(
2023-09-17 MMDetection 整体构建流程(一)
训练核心组件训练部分一般包括9个核心组件，总体流程是：任何一个batch的图片先输入到backbone中进行特征提取，典型的骨干网络是ResNet输出的单尺度或者多尺度特征图输入到neck模块中进行特征融合或者增强，典型的neck是FPN上述多尺度特征最终输入到head部分，一般都会
2023-08-09基于YoloV8的人体骨架提取代码编写时遇到的问题
1、获取骨架端点的xy轴位置在最初进行编写的时候，我借鉴了网上的代码，其中出现最多的便是bboxes_keypoints=results[0].keypoints.cpu().numpy().astype('uint32')，但是实际运行时往往会报错AttributeError:'Keypoints'objecthasnoattribute'astype'.Seevalidattributes
2023-08-09基于YOLO V8的人体骨架提取
题外话：我记得没错的话，最多两年前，当时YOLO系列才出到V5，怎么现在都出到V8了啊。1、前言YOLOv8是ultralytics公司在2023年1月10号开源的YOLOv5的下一个重大更新版本，目前支持图像分类、物体检测和实例分割任务，该公司同样也是YOLOV5的提出者，本文将面对YOLOV8-pose的本地部署
2023-05-20python 检测屏幕指定区域有变化即截图
fromPILimportImageChops#$pipinstallpillowfrompyscreenshotimportgrab#$pipinstallpyscreenshotfromdatetimeimportdatetimeimporttime,sys,reim=grab(bbox=(160,180,1760,1080))a=0whileTrue:#http://effbot.org/zone/pil-comparing-imag