首页 > 其他分享 >吴恩达深度学习笔记:卷积神经网络(Foundations of Convolutional Neural Networks)3.5-3.6

吴恩达深度学习笔记:卷积神经网络(Foundations of Convolutional Neural Networks)3.5-3.6

时间:2024-10-15 21:51:28浏览次数:12  
标签:Convolutional 吴恩达 这个 边界 格子 对象 3.6 19 算法

目录

第四门课 卷积神经网络(Convolutional Neural Networks)

第三周 目标检测(Object detection)

3.5 Bounding Box 预测(Bounding box predictions)

在上一个视频中,你们学到了滑动窗口法的卷积实现,这个算法效率更高,但仍然存在问题,不能输出最精准的边界框。在这个视频中,我们看看如何得到更精准的边界框。

在这里插入图片描述
在滑动窗口法中,你取这些离散的位置集合,然后在它们上运行分类器,在这种情况下,这些边界框没有一个能完美匹配汽车位置,也许这个框(编号 1)是最匹配的了。还有看起来这个真实值,最完美的边界框甚至不是方形,稍微有点长方形(红色方框所示),长宽比有点向水平方向延伸,有没有办法让这个算法输出更精准的边界框呢?
在这里插入图片描述
其中一个能得到更精准边界框的算法是 YOLO 算法,YOLO(You only look once)意思是你只看一次,这是由 Joseph Redmon,Santosh Divvala,Ross Girshick 和 Ali Farhadi 提出的算法。

是这么做的,比如你的输入图像是 100×100 的,然后在图像上放一个网格。为了介绍起来简单一些,我用 3×3 网格,实际实现时会用更精细的网格,可能是 19×19。基本思路是使用图像分类和定位算法,前几个视频介绍过的,然后将算法应用到 9 个格子上。(基本思路是,采用图像分类和定位算法,本周第一个视频中介绍过的,逐一应用在图像的 9 个格子中。)更具体一点,你需要这样定义训练标签,所以对于 9 个格子中的每一个指定一个标签

标签:Convolutional,吴恩达,这个,边界,格子,对象,3.6,19,算法
From: https://blog.csdn.net/weixin_43597208/article/details/142954828

相关文章

  • 自然语言处理之语音识别:Convolutional Neural Networks (CNN):深度学习与神经网络基础
    自然语言处理之语音识别:ConvolutionalNeuralNetworks(CNN):深度学习与神经网络基础深度学习与神经网络基础subdir1.1:神经网络的基本概念神经网络是一种模仿人脑神经元结构的计算模型,用于处理复杂的数据模式识别和预测问题。它由输入层、隐藏层和输出层组成,每一层......
  • 自然语言处理之语音识别:Convolutional Neural Networks(CNN):语音识别导论
    自然语言处理之语音识别:ConvolutionalNeuralNetworks(CNN):语音识别导论自然语言处理与语音识别基础自然语言处理概览自然语言处理(NLP)是人工智能领域的一个重要分支,它关注如何使计算机能够理解、解释和生成人类语言。NLP技术广泛应用于文本分类、情感分析、机器翻译、......
  • 自然语言处理之语音识别:Convolutional Neural Networks(CNN)与迁移学习_
    自然语言处理之语音识别:ConvolutionalNeuralNetworks(CNN)与迁移学习自然语言处理与语音识别基础自然语言处理概览自然语言处理(NLP)是人工智能领域的一个重要分支,它关注如何使计算机能够理解、解释和生成人类语言。NLP技术广泛应用于文本分类、情感分析、机器翻译、问......
  • python3.6 解析svg保存到mysql
     1importjson2fromcollectionsimportCounter3fromjsonimportJSONDecodeError45importmysql6importrequests7fromlxmlimportetree89#定义远程SVG文件的URL10file=r'D:\tmp_files\jmx\0919_3568.txt'11dat......
  • 吴恩达机器学习笔记(2-1到2-7)
    吴恩达机器学习笔记(2-1到2-7)https://www.bilibili.com/video/BV164411b7dx?p=5https://www.bilibili.com/video/BV164411b7dx?p=6https://www.bilibili.com/video/BV164411b7dx?p=7https://www.bilibili.com/video/BV164411b7dx?p=8https://www.bilibili.com/video/BV164411b......
  • LLM权威教程:吴恩达 面向开发者的LLM入门教程+开源大模型食用指南,普通学习者也能看懂!
    今天给大家推荐一本由吴恩达和OpenAI团队共同编写的关于大型语言模型(LLM)的权威教程<面向开发者的LLM入门教程>!在Github上已经高达50kstar了,这含金量不用多说,在这里给大家强烈推荐一波,不多bb直接开始介绍!这本教程旨在为开发者提供全面而系统的LLM知识和技能,结合了吴恩达在......
  • centos7.6源码方式安装python3.6.8
    1安装依赖包centos7.6是没有自带python3的[root@opgs201~]#cat/etc/redhat-releaseCentOSLinuxrelease7.6.1810(Core)[root@opgs201~]#python3bash:python3:commandnotfound...Similarcommandis:'python'先挂载iso文件,配置本地yum源##挂载虚拟机的光盘......
  • 3.6 使用Ultralytics YOLO进行模型基准测试
    3.6使用UltralyticsYOLO进行模型基准测试UltralyticsYOLO生态系统及其集成引言当您的模型完成训练和验证后,下一步就是评估其在各种现实场景中的表现。UltralyticsYOLO11的基准测试模式通过提供一个强大的框架,用于评估模型在各种导出格式下的速度和准确性。观看视频:Ult......
  • VMware Fusion 13.6.1 发布下载,修复 4 个已知问题
    VMwareFusion13.6.1发布下载,修复4个已知问题VMwareFusion13.6.1forMac-领先的免费桌面虚拟化软件适用于基于Intel处理器和搭载Apple芯片的Mac的桌面虚拟化软件请访问原文链接:https://sysin.org/blog/vmware-fusion-13/查看最新版。原创作品,转载请保留出处。......
  • CS 259 Accelerating Convolutional Neural Network
    Fall2024CS259Lab1AcceleratingConvolutionalNeuralNetwork(CNN)onFPGAsusingMerlinCompilerDueOctober911:59pmDescriptionYourtaskistoacceleratethecomputationoftwolayersinaconvolutionalneuralnetwork(CNN)usingahigh-levelsynt......