首页 > 其他分享 >MXnet-arcface数据集准备

MXnet-arcface数据集准备

时间:2023-11-26 15:46:37浏览次数:28  
标签:文件夹 文件 MXnet -- jpg lst train 准备 arcface

title: MXnet-arcface数据集准备
banner_img: https://proxy.thisis.plus/202304271933740.png
date: 2023-5-8 21:28:00
categories:
- 工具

众所周知,mxnet是一个沐神主导开发的一个深度学习框架,之前听李沐的讲论文时也听他说过很多次,但是已知没有机会使用,最近接触了一个项目,有机会感受了一些mxnet,但是也踩了很多坑。所有需要的脚本文件可以在https://github.com/StudyingLover/menet-Arcface-tools下载

image.png

mxnet 的数据与别处的是不同的,他的训练集是两个文件,分别以.idx.rec 结尾, 测试集是以.bin 结尾的一个二进制文件。

创建lst,idx,rec

我们需要按照特定方式放置图片,首先创建一个大的文件夹,里面创建一个个子文件夹,每个文件夹放置相同类别的图片

/image_folder
├── 0_0_0000000
│   ├── 0_0.jpg
│   ├── 0_1.jpg
│   ├── 0_2.jpg
│   ├── 0_3.jpg
│   └── 0_4.jpg
├── 0_0_0000001
│   ├── 0_5.jpg
│   ├── 0_6.jpg
│   ├── 0_7.jpg
│   ├── 0_8.jpg
│   └── 0_9.jpg
├── 0_0_0000002
│   ├── 0_10.jpg
│   ├── 0_11.jpg
│   ├── 0_12.jpg
│   ├── 0_13.jpg
│   ├── 0_14.jpg
│   ├── 0_15.jpg
│   ├── 0_16.jpg
│   └── 0_17.jpg
├── 0_0_0000003
│   ├── 0_18.jpg
│   ├── 0_19.jpg
│   └── 0_20.jpg
├── 0_0_0000004

接下来先生成一个.lst 文件,这个文件包含了所有的文件,训练集和测试集按照8:2划分

python -m mxnet.tools.im2rec --list --recursive train 图片文件夹 –test-ratio 0.8

这段代码会生成两个文件夹train_train.lsttrain_test.lst

生成训练集文件

接下来生成训练集文件

python -m mxnet.tools.im2rec train_train.lst --quality 100 图片文件夹

需要给生成的文件改个名字

mv train_train.idx train.idx
mv train_train.rec train.rec

下面创建property配置文件

训练集图片数量 图片大小 图片大小

例如

10000 112 112

创建pair文件

这一步多少有点奇怪,pair文件里面的结构是

img1_path img2_path 0
img3_path img4_path 1

生成方式也很简单啦,运行

python3 generate_image_pairs.py --data-dir 图片文件夹路径 --outputtxt train.txt --num-samepairs 3000

num-samepairs 是个魔数,看心情写吧,这里我为了大量生成,我又写了个脚本,重复执行

python repeat_cmd.py
python detele_empty.py
cp train.txt 图片文件夹

生成验证集bin

python lfw2pack.py --data-dir 图片文件夹 --output test.bin --num-samepairs 300

ok就这样,我们生成了需要的train.idx train.rec,test.bin

标签:文件夹,文件,MXnet,--,jpg,lst,train,准备,arcface
From: https://www.cnblogs.com/studyinglover/p/17857333.html

相关文章

  • 搞本资料准备高项。。。。信息系统项目管理师 官方教程(第四版)
    这玩意真有啥用吗?单位一定要求考。。。前辈给了个最新的电子版,让我自己看。。。https://www.kdocs.cn/l/cn7YH7yl1vNg信息系统项目管理师官方教程(第四版)......
  • PMP考试在即,应如何准备?
    距离11月25日PMP®考试越来越近,很多同学现在心里可能有点慌,其实这很正常,但也没必要过于紧张。  下面,老师就来帮你梳理一下考前的这段时间应该做点什么,缓解一下考前紧张的心情。 考前的这段时间应该做点什么? 1、持续复习巩固,梳理知识框架 无论自己平时学习状态如何,考前都不能消......
  • (私人lora数据准备)MJ数据转lora训练的处理流程
    1.【删除乱码并打标签】删前缀(用户名),删后缀(乱码),加统一标签,并打开excel微调。(输入项为1.单个文件夹地址2.需要文件夹内加上的标签名)*注意:此时若要加多个标签,请用英文逗号“,”隔开。 importosimportopenpyxlimportreUNWANTED_UNITS=["undefined","皮皮","zly324"]......
  • 增强For循环 为后边数组做准备
     ......
  • 生产力-准备篇-1、自己动手装机
    原来的笔记本电脑性能不太行了,趁着JD搞活动,自己组装了1台AMD芯片的台式机,具体配置如下:CPU:AMD7700X,淘宝入手,盒装1819内存:金百达银爵C32DDR56400,1277.85硬盘:TiPlus7100 1TB,409,自己加装了1块1TB的2.5寸SATA存数据主板:华硕TUFGAMINGB650M-PLUSWIFI,1196.75机箱:乔思伯(J......
  • task0003前端项目准备的学习笔记(之前忘了发不好意思!)
    2023-10-26task0003前端学习笔记JavaScript作用域学习笔记①:今天看了http://www.laruence.com/2009/05/28/863.html这位作者讲了js的作用域原理,让我豁然开朗,原来函数定义式与函数表达式的不同会导致作用域作用不一样比如:varname='laruence';functionecho(){alert(name......
  • 最新demo版|如何0-1开发支付宝小程序之前期准备篇(一)
    小程序作为目前一种轻量、便捷的应用、目前应用越来越广泛了。很多没有开发经验的开发同学可能初次接触就是小程序开发,为了详细讲解下小程序开发的步骤,我会按照小程序的开发流程一步一步从零开始给大家介绍下如何开发支付宝小程序,后续教程中会更新最新版demo给到大家。今天......
  • 秋招没进大厂,春招该怎么准备呢?
    前言从今年的秋招来看,就业形势真的很严峻,太卷了。很多人到现在都没有满意的offer,甚至没有offer!如果再错过明年的春招,就成往届生了,面对春招的背水一战,想要扭转乾坤,那应该要怎么做呢?全干货,一定要花时间看完!!!!首先1、千万别傻乎乎的干等着春招,你会非常被动的!为什么呢?第一,春招只有一小部......
  • 想快速进入人工智能领域的Java程序员?你准备好了吗?
    引言今天我们来探讨一下作为Java程序员,如何迅速融入人工智能的领域。,当前有一些流行的LLMs选择,例如ChatGPT、科大讯飞的星火、通义千问和文心一言等。如果你还没有尝试过这些工具,那么现在也不失为一个很好的机会,赶快体验一下吧。这些工具不仅能够为你的Java编程工作提供更多的可......
  • 如何准备2024年的系统设计面试?
    1前言如果你正在准备软件工程师或软件开发人员的面试,那么你可能知道由于其开放性质和广泛性,准备系统设计是多么困难,但同时你也不能忽略它。在软件工程界,如果你正在申请高级工程师/主管/架构师或更高级别的角色,系统设计是最受追捧的技能,也是整个过程中最重要的环节之一。如......