18个面向初学者的经典开源计算机视觉项目-图像分类篇（一）

时间：2022-12-30 10:34:52浏览次数：80

标签：18 分类开源初学者 https 图像视觉

18个经典开源计算机视觉项目分为以下几类：

图像分类

人脸识别

用GANs进行神经风格转换

场景文本检测

基于DETR的目标检测

语义分割

自动驾驶车辆的车道检测

图像字幕

人体姿势估计项目

基于面部表情的情绪识别

今天主要给大家介绍一下，图像分类：

用于图像分类的开源计算机视觉项目图像分类是计算机视觉中的一项基本任务。在这里，目标是通过为图像指定特定标签来对图像进行分类。我们人类很容易理解和分类我们看到的图像。但对于一台机器来说情况就大不相同了。对机器来说，区分汽车和大象是一项繁重的任务。

以下是两个最著名的图像分类开源项目：

CIFAR-10

CIFAR-10数据集是一组图像，通常用机器学习和计算机视觉算法。它是机器学习研究中最流行的数据集之一。它包含10个不同类别的60000张32×32彩色图像。这些类代表飞机、汽车、鸟、猫、鹿、狗、青蛙、马、船和卡车。

ImageNet

ImageNet数据集是用于计算机视觉研究的大型可视化数据库。该项目已经手工标注了1400多万张图片，以显示图片中的对象，并且在至少100万张图片中，还提供了目标框。ImageNet包含20000多个类别！

作为初学者，您可以使用Keras或PyTorch从头开始使用神经网络。为了获得更好的结果并提高学习水平，我建议通过VGG-16、Restnet-50、Googlenet等预先训练的模型使用迁移学习。

18个面向初学者的经典开源计算机视觉项目-图像分类篇（一）_数据集

我建议阅读以下文章，以了解更多有关图像分类的信息：

使用Python代码进行图像分类的前4个预训练模型

https://www.analyticsvidhya.com/blog/2020/08/top-4-pre-trained-models-for-image-classification-with-python-code/?utm_source=blog&utm_medium=18_open-Source_computer_vision_projects

为了更好地理解图像分类，我还建议阅读以下论文：

基于深度卷积神经网络的图像网络分类

https://proceedings.neurips.cc/paper/2012/file/c399862d3b9d6b76c8436e924a68c45b-Paper.pdf

使卷积网络变得更深

https://arxiv.org/abs/1409.4842

图像识别中的深度残差学习

https://arxiv.org/abs/1512.03385

后面会对里面涉及的内容进行详细讲解。

原文参考链接：

https://www.analyticsvidhya.com/blog/2020/09/18-open-source-computer-vision-projects-beginners/

微信公众号：

18个面向初学者的经典开源计算机视觉项目-图像分类篇（一）_图像分类_02

下载对应的论文，在公众号中回复:paper

标签：18,分类,开源,初学者,https,图像,视觉
From： https://blog.51cto.com/u_15717531/5979190

【活动】2021年开源操作系统夏令营
鹏城实验室和清华大学组织的2020年开源操作系统夏令营收到同学们的积极响应，参与夏令营的同学在今年的“2021全国大学生计算机系统能力大赛-操作系统赛”的初赛中都有不错......
Ubuntu18.04安装docker-compose
下载compose下载链接：https://github.com/docker/compose上传到乌班图系统可以直接拖拽过去，放到/usr/local/bin/目录下修改包名mvdocker-compose-linux-x86_......
第一章《初学者问题大集合》第7节：编写第一个Java程序
下载并安装好IDEA之后，就可以编写Java程序啦！前文曾经讲过，Java程序最初的存在形式是Java源文件，经过编译之后又会产生字节码文件。当今时代，软件项目的规模越来越大，因此软件项......
[ICLR18]联合句法和词汇学习的神经语言模型
原文链接：NeuralLanguageModelingbyJointlyLearningSyntaxandLexicon论文地址：NeuralLanguageModelingbyJointlyLearningSyntaxandLexicon......
[arXiv18]更快的基于非二叉化自底向上策略的转移系统成分句法分析
原文链接：FasterShift-ReduceConstituentParsingwithaNon-Binary,Bottom-UpStrategy论文地址：FasterShift-ReduceConstituentParsingwithaNon-......
用户登录界面（Bootstrap）入门教程01（适合初学者）
首先博主也是小白，之前没学过前端，花了一晚上做了个登录界面，想分享给大家，比较适合初学者来快速学习，博主以后也好好学基础的前端。首先先上我做的登录界面的图：因为博主水平有限......
基于Qt的桌面客户端组件化框架DT 开源啦
这个是本人在工作中基于QT开发的组件化桌面开发框架，目前打算开源出来提供给大家，节省大家的开发时间和效率，希望对大家的开发有所帮助，也欢迎提出意见和改进建议1.为什么开源D......
爱可可推荐！关于竞赛思路，方法和代码实践，Datawhale数据竞赛Baseline开源分享！
数据竞赛中baseline是最入门的分享，它不仅有思路、方法还有内容；或许你与Top选手的差距就是一个baseline！01项目介绍如果你是数据竞赛的初学者、爱好者，比赛的baseline不仅是比......
java初学者常用单词
public公开的static静态的class类void不返回任何值main主方法名称system系统string字符串args参数out输出print打印println......
[JZSC2017]【GDOI2018模拟7.12】总结
Text今天睡眠充足，状态还不错。看题今天画风稍微正常。。。。等等，我什么都没说T1奇怪的逆序对T2数据范围好像直接矩乘啊不对状态太大了弄不了T370分裸反演，满分杜教筛？......

18个面向初学者的经典开源计算机视觉项目-图像分类篇（一）

相关文章

赞助商

阅读排行