一.图像处理vs 计算机视觉
图像处理
输入是图像或视频,输出也是图像或视频。
计算机视觉
输入是图像或视频,输出不仅限于图像或视频,还可以是语义标签、3维场景的结构信息等,更强调的是图像或者视频内容的输出。
二.计算机视觉介绍
人类的对智能的传统评价不能用来评价机器!
计算机视觉的目标
穿越“语义鸿沟” ——建立像素到语义的映射
人类视觉系统的缺陷:运动视盲(对于主体过于关注,对于细节不关注)
分割:人类是用上下文结合的方式去理解图像的
计算机视觉顶级会议
CVPR(IEEE Conference on Computer Vision and Pattern Recognition)
ICCV(International conference on computer vision)
行业先驱:David Marr的工作
计算理论:计算的目的是什么?该问题的已知或可以施加的约束是什么?
表达和算法:输入、输出和中间信息是如何表达的?使用哪些算法来计算所期望的结果?
硬件实现:表达和算法是如何映射到实际硬件上的?硬件的约束怎么样才能用于指导表达和算法的选择?
视觉表达的三阶段:
输入图像——>边缘图——>语义信息——>3D模型
计算机视觉的研究方向大概分为两类:三维场景的结构信息和语义信息
计算机视觉任务和算法是交替发展的,大多算法是将其他领域的算法进行优化和改进后引入计算机视觉领域。
视觉识别:
对于视觉识别任务而言,目前最有效的工具就是卷积神经网络。
图像分类、目标检测、图像分割、图像描述、图像生成
深度学习三要素
算法、数据、算力
标签:视频,计算机,北邮,语义,算法,图像,视觉 From: https://blog.csdn.net/2301_77297567/article/details/141535173