• 2024-08-29训练yolov5时出现报错:AttributeError: ‘FreeTypeFont‘ object has no attribute ‘getsize‘
    报错:Traceback(mostrecentcalllast):File"D:\anaconda3_xz\envs\luopytorch\lib\threading.py",line932,in_bootstrap_innerself.run()File"D:\anaconda3_xz\envs\luopytorch\lib\threading.py",line870,inrunself._target(*s
  • 2024-08-2728-目标检测
    importtorchimportmatplotlib.pyplotaspltfromsympy.physics.control.control_plotsimportmatplotlibfromd2limporttorchasd2l#plt.figure(figsize=(3.5,2.5))img=d2l.plt.imread('./image/catdog.jpg')#plt.imshow(img)#plt.show()de
  • 2024-07-27ComfyUI插件:ComfyUI Impact 节点(一)
    前言:学习ComfyUI是一场持久战,而ComfyUIImpact是一个庞大的模块节点库,内置许多非常实用且强大的功能节点,例如检测器、细节强化器、预览桥、通配符、Hook、图片发送器、图片接收器等等。通过这些节点的组合运用,我们可以实现的工作有很多,例如自动人脸检测和优化修复、区域增强、
  • 2024-07-27ComfyUI插件:ComfyUI Impact 节点(一)
    前言:学习ComfyUI是一场持久战,而ComfyUIImpact是一个庞大的模块节点库,内置许多非常实用且强大的功能节点,例如检测器、细节强化器、预览桥、通配符、Hook、图片发送器、图片接收器等等。通过这些节点的组合运用,我们可以实现的工作有很多,例如自动人脸检测和优化修复、区域增
  • 2024-07-19paddleocr识别并按行输出结果
    frompaddleocrimportPaddleOCR#初始化OCR引擎ocr=PaddleOCR(use_angle_cls=True,lang="ch")#使用中文模型#对图像进行OCR识别img_path='./imgs/img_3.png'result=ocr.ocr(img_path,cls=True)#按y坐标对文本块进行排序sorted_result=sorted(result,
  • 2024-06-07Yolov8和Yolov10的差异以及后处理实现
    Yolo模型可分为4个维度的概念模型版本、数据集、模型变体(Variants)、动态/静态模型。Yolo各模型版本进展历史Yolov(2015年华盛顿大学的JosephRedmon和AliFarhadi发布)Yolov2(2016年JosephRedmon发布)Yolov3(2018年JosephRedmon发布)Yolov4(2020年AlexeyBochkovskiy发布)Yolov5(2
  • 2024-06-06提取PAD LOCATION 坐标
    hiSetBindKey("Layout""F9""smpGUIPadExtract()")procedure(smpGUIPadExtract()let(() padlayerName=hiCreateStringField( ?name`padlayerName ?prompt"LayerName" ) padlayerPpos=hiCreateStringF
  • 2024-05-26代码解析—part 2 数据集加载MFS—CVPR2023—Implicit Identity Leakage: The Stumbling Block to Improving Deepfake
    论文讲解请看:https://blog.csdn.net/JustWantToLearn/article/details/138758033代码链接:https://github.com/megvii-research/CADDM在这里,我们简要描述算法流程,着重分析模型搭建细节,以及为什么要这样搭建。part1:数据集准备,请看链接https://blog.csdn.net/JustWantToLe
  • 2024-05-22coco数据集转voc数据集
    前言在模型训练的学习中voc和coco是最常见的两种格式,并且经常需要互相转换,本篇提供coco数据集转voc数据集的方法。coco格式分析COCO的全称是CommonObjectsinCOntext,是微软团队提供的一个可以用来进行图像识别的数据集。MSCOCO数据集中的图像分为训练、验证和测试集。
  • 2024-04-21李沐动手学习深度学习 锚框部分代码解析
    这里只是对代码的解析,我在写这个解析的时候并没有看后面的内容,只能大概猜一下可能是要干嘛的首先是import相关工具,这里使用pytorch%matplotlibinlineimporttorchfromd2limporttorchasd2ltorch.set_printoptions(2)#精简输出精度1.生成锚框接下来是第一个难点,这
  • 2024-04-06数码相框-LCD显示多行文字
    显示几行文字:从左显示:先描边再算出边框。居中显示:先算出边框,再确定坐标描画。从左显示​​第一行数据的起始位置是从(0,24)开始的。​要知道第二行数据从哪里开始,我们得知道画出来的矢量字体的边框是多少:​​​​这个数据是笛卡尔坐标。​​​​测试:​​#include
  • 2024-04-06数码相框-LCD显示多行文字
    显示几行文字:从左显示:先描边再算出边框。居中显示:先算出边框,再确定坐标描画。从左显示​​第一行数据的起始位置是从(0,24)开始的。​要知道第二行数据从哪里开始,我们得知道画出来的矢量字体的边框是多少:​​​​这个数据是笛卡尔坐标。​​​​测试:​​#include
  • 2024-03-27FreeType Glyph Conventions 翻译(3) ——Glyph Metrics 字符图形参数
    原文地址https://freetype.org/freetype2/docs/glyphs/glyphs-3.html目录基线,笔位置以及布局Baseline,pensandlayouts排版参数和包围盒Typographicmetricsandboundingboxes定位和步进BearingsandAdvances网格对齐Theeffectsofgrid-fitting文本宽度和包围盒Text
  • 2024-03-22开源计算机视觉库OpenCV详解
    OpenCV(OpenSourceComputerVisionLibrary)是一个开源的计算机视觉和机器学习软件库。OpenCV最初由Intel开发,后来支持由WillowGarage和Itseez(被Intel收购)进行的维护和更新。这个库旨在为实时的计算机视觉应用提供一个高效的、易于使用的环境,并且是用C++编写的,尽管它提供了
  • 2024-03-08Marker 源码解析(一)
    .\marker\benchmark.pyimportargparseimporttempfileimporttimefromcollectionsimportdefaultdictfromtqdmimporttqdmfrommarker.convertimportconvert_single_pdffrommarker.loggerimportconfigure_loggingfrommarker.modelsimportload_all_mo
  • 2024-01-31YOLO
    参考目录:论文:https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Redmon_You_Only_Look_CVPR_2016_paper.pdfYOLO论文解读:https://zhuanlan.zhihu.com/p/31427164fasterRCNN是two-stage的目标检测算法,即分别完成分类和回归任务。而YOLO提出将物体检测作为一
  • 2024-01-31YOLOv2
    论文:https://openaccess.thecvf.com/content_cvpr_2017/papers/Redmon_YOLO9000_Better_Faster_CVPR_2017_paper.pdf改进点讲解1:https://zhuanlan.zhihu.com/p/71179215改进点讲解2:https://blog.csdn.net/weixin_40227656/article/details/116018040协变量偏移和BatchNormaliz
  • 2023-10-27bbb
    智警杯赛前实训目录智警杯赛前实训文本情报智能化处理与分析短信涉博分类任务介绍知识点实验步骤导入数据任务解析数据转换任务解析训练与预测任务解析网络诈骗分类任务介绍知识点实验步骤数据清洗与预处理①读取数据②分词,去停用词任务解析文本向量化③.文本向量化④.划分训练测
  • 2023-10-26hdict文件操作
    create_dict(DLDataset)set_dict_tuple(DLDataset,'class_ids',[0,1,2,3])set_dict_tuple(DLDataset,'class_names',['ng_anlie','ng_innerwuran','ng_innerwuranmh','ng_outterwuran'])set_dict_tuple(
  • 2023-09-17 MMDetection 整体构建流程(一)
    训练核心组件训练部分一般包括9个核心组件,总体流程是:任何一个batch的图片先输入到backbone中进行特征提取,典型的骨干网络是ResNet输出的单尺度或者多尺度特征图输入到neck模块中进行特征融合或者增强,典型的neck是FPN上述多尺度特征最终输入到head部分,一般都会
  • 2023-08-09基于YoloV8的人体骨架提取代码编写时遇到的问题
    1、获取骨架端点的xy轴位置在最初进行编写的时候,我借鉴了网上的代码,其中出现最多的便是bboxes_keypoints=results[0].keypoints.cpu().numpy().astype('uint32'),但是实际运行时往往会报错AttributeError:'Keypoints'objecthasnoattribute'astype'.Seevalidattributes
  • 2023-08-09基于YOLO V8的人体骨架提取
    题外话:我记得没错的话,最多两年前,当时YOLO系列才出到V5,怎么现在都出到V8了啊。1、前言YOLOv8是ultralytics公司在2023年1月10号开源的YOLOv5的下一个重大更新版本,目前支持图像分类、物体检测和实例分割任务,该公司同样也是YOLOV5的提出者,本文将面对YOLOV8-pose的本地部署
  • 2023-05-20python 检测屏幕指定区域 有变化即截图
    fromPILimportImageChops#$pipinstallpillowfrompyscreenshotimportgrab#$pipinstallpyscreenshotfromdatetimeimportdatetimeimporttime,sys,reim=grab(bbox=(160,180,1760,1080))a=0whileTrue:#http://effbot.org/zone/pil-comparing-imag
  • 2023-05-17团队开发第二阶段3
    今天开始将算法优化,以下是优化后代码。importcopyimporttimefromabcimportabstractmethodfromqueueimportEmptyimportcv2importnumpyasnpimporttorchfromPILimportImageFont,Image,ImageDrawfromPyQt5.QtGuiimportQPixmap,QImagefrommodels.conc
  • 2023-04-26[重读经典论文]YOLOv1
    1.前言由JosephRedmon等人2016年在论文《YouOnlyLookOnce:Unifified,Real-TimeObjectDetection》中提出的一阶段目标检测算法,核心思想是将物体检测任务视为回归问题。它通过将图像分成S×S个网格,每个网格负责预测该网格中是否存在物体以及物体的类别和位置信息。使用单