首页 > 其他分享 >I3D笔记

I3D笔记

时间:2023-11-26 14:58:23浏览次数:32  
标签:视频 Stream Kinetics Two 笔记 Inception I3D

title: I3D笔记
banner_img: https://drive.studyinglover.com/api/raw/?path=/photos/blog/background/1679397045791.jpg
date: 2023-4-23 22:14:00

I3D笔记

I3D是一个视频理解模型,采用双流网络的架构,他的核心贡献是提出了如何对2d网络进行膨胀操作,同时提出了一个新的数据集 Kinetics

工作回顾

image.png

在以前,视频理解有三种做法

  1. LSTM
  2. 3D ConvNets
  3. Two-Stream Networks(双流网络)

Two-Stream Inflated 3D ConvNets

这篇文章提出的模型被称为 Two-Stream Inflated 3D ConvNets

Inflate 是模型的核心操作,含义是将一个2d模型"膨胀"成3d模型,做法很简单,就是把一个\(N*N\) 的层变成\(N*N*N\) ,同时也将参数复制了\(N\) 遍。

Kinetics

在视频领域,在一个足够大的数据集上训练一个动作分类网络,当应用于不同的时间任务或数据集时,是否会有类似的性能提升是一个悬而未决的问题。构建视频数据集的挑战意味着大多数流行的动作识别基准。

Kinetics 有400个人体动作类,每个类有400多个例子,每个都来自一个独特的 YouTube 视频

整体架构

作者选择了 Inception-v1 构建整个神经网络(作者当时不适用Inception-v1是因为当时认为Inception在视频理解更合适,但架不住ResNet 太棒了,作者在18年也换成了ResNet)
image.png

图中的Inc. 就是经典的Inception-v1 块了,只是做了Inflating 操作

标签:视频,Stream,Kinetics,Two,笔记,Inception,I3D
From: https://www.cnblogs.com/studyinglover/p/17857227.html

相关文章

  • DSDN笔记
    title:Dual-StreamDiffusionNetforText-to-VideoGeneration笔记banner_img:https://cdn.studyinglover.com/pic/2023/08/b6f940f512488c10b7a1bf40eb242cae.pngindex_img:https://cdn.studyinglover.com/pic/2023/08/3021b6624ee4f2093c6166b6a80cd643.pngdate:2023......
  • DINO-v2笔记
    title:DINO-v2笔记banner_img:https://cdn.studyinglover.com/pic/2023/07/b5c4ecf9aa476ca1073f99b22fe9605e.jpgdate:2023-7-270:04:00categories:-文字生成图片DINO-v2笔记DINO-v2一种无监督学习的预训练方法,可以生成具有强大泛化能力的视觉特征,适用于各种图像分布......
  • CaltechCS122 笔记:Assignment 2: SQL Translation and Joins
    Assignment2:SQLTranslationandJoinsTranslationandjoinPlanNode及其子类,如图所示:......
  • MIT6.824 笔记:Lab2 Raft
    MIT6.824笔记:Lab2Raft环境配置goland环境配置同级目录下其他包无法引用,需要修改相关参数......
  • 《信息安全系统设计与实现》第十三周学习笔记
    第十四章MYSQL实践mysql简介MySQL是一个开源数据库管理系统,由服务器和客户机组成。在将客户机连接到服务器后,用户可向服务器输入SQL命令,以便创建数据库,删除数据库,存储、组织和检索数据库中的数据。MySQL有广泛的应用。mysql安装在ubuntu中使用sudoaptinstallmysql-server......
  • 信息安全系统设计与实现——学习笔记11
    任务详情:自学教材,提交学习笔记Part1知识点归纳&GPT提问知识点归纳1.TCP/IP协议TCP/IP协议:TCP代表传输控制协议。IP代表互联网协议。目前有两个版本的IP,即IPv4和IPv6,IPv4使用32位地址,IPv6使用128位地址。TCP/IP各个层级及使用的协议如下图所示:2.IP(1)IP协议ip协议用于在ip......
  • ShardingSphere学习笔记
    MySQL7的root密码校验方式:mysql_native_passwordMySQL8的root密码校验方式:caching_sha2_password将mysql8的root密码校验方式改为7的:ALTERUSER'root'@'%'IDENTIFIEDWITHmysql_native_passwordBY'123456'; 进入docker容器:防止中文显示乱码:dockerexec-itxxx-na......
  • django学习笔记06 查询
    查询库中某个字段的重复值并计数shufareadingcourse.objects.filter(lessonId=targetid[0]['id']).values('qtype').order_by().annotate(count=Count('qtype'))当数据库中有这样的数据,可以看到qtype会有不同类别,但是又会有重复,所以当查询时可以使用这种方式查询到有多少个LETTER......
  • 20231126GESP三级笔记
    逛商场点击查看代码#include<bits/stdc++.h>usingnamespacestd;constintN=1e6+10;intn,a[N],x,ans=0;intmain(){cin>>n;for(inti=1;i<=n;i++)cin>>a[i];cin>>x;for(inti=1;i<=n;i++){if(a[i]<=......
  • 学习笔记11
    TCP/IP和网络编程一、知识点归纳(一)网络编程简介如今,上网已成为日常生活的需要。虽然大多数人可能只把互联网作为一种信息收集、网上购物和社交媒体等的工具,但计算机科学的学生必须对互联网技术有一定的了解,并掌握一定的网络编程的技能。在本章中,我们将介绍TCP/IP网络和网络编程......