I3D笔记

时间：2023-11-26 14:58:23浏览次数：32

标签：视频 Stream Kinetics Two 笔记 Inception I3D

title: I3D笔记
banner_img: https://drive.studyinglover.com/api/raw/?path=/photos/blog/background/1679397045791.jpg
date: 2023-4-23 22:14:00

I3D笔记

I3D是一个视频理解模型，采用双流网络的架构，他的核心贡献是提出了如何对2d网络进行膨胀操作，同时提出了一个新的数据集 Kinetics

工作回顾

在以前，视频理解有三种做法

LSTM
3D ConvNets
Two-Stream Networks（双流网络）

Two-Stream Inflated 3D ConvNets

这篇文章提出的模型被称为 Two-Stream Inflated 3D ConvNets

Inflate 是模型的核心操作，含义是将一个2d模型"膨胀"成3d模型，做法很简单，就是把一个\(N*N\) 的层变成\(N*N*N\) ,同时也将参数复制了\(N\) 遍。

Kinetics

在视频领域，在一个足够大的数据集上训练一个动作分类网络，当应用于不同的时间任务或数据集时，是否会有类似的性能提升是一个悬而未决的问题。构建视频数据集的挑战意味着大多数流行的动作识别基准。

Kinetics 有400个人体动作类，每个类有400多个例子，每个都来自一个独特的 YouTube 视频

整体架构

作者选择了 Inception-v1 构建整个神经网络(作者当时不适用Inception-v1是因为当时认为Inception在视频理解更合适，但架不住ResNet 太棒了，作者在18年也换成了ResNet)

图中的Inc. 就是经典的Inception-v1 块了，只是做了Inflating 操作

标签：视频,Stream,Kinetics,Two,笔记,Inception,I3D
From： https://www.cnblogs.com/studyinglover/p/17857227.html

DSDN笔记
title:Dual-StreamDiffusionNetforText-to-VideoGeneration笔记banner_img:https://cdn.studyinglover.com/pic/2023/08/b6f940f512488c10b7a1bf40eb242cae.pngindex_img:https://cdn.studyinglover.com/pic/2023/08/3021b6624ee4f2093c6166b6a80cd643.pngdate:2023......
DINO-v2笔记
title:DINO-v2笔记banner_img:https://cdn.studyinglover.com/pic/2023/07/b5c4ecf9aa476ca1073f99b22fe9605e.jpgdate:2023-7-270:04:00categories:-文字生成图片DINO-v2笔记DINO-v2一种无监督学习的预训练方法，可以生成具有强大泛化能力的视觉特征，适用于各种图像分布......
CaltechCS122 笔记：Assignment 2: SQL Translation and Joins
Assignment2:SQLTranslationandJoinsTranslationandjoinPlanNode及其子类，如图所示：......
MIT6.824 笔记：Lab2 Raft
MIT6.824笔记：Lab2Raft环境配置goland环境配置同级目录下其他包无法引用，需要修改相关参数......
《信息安全系统设计与实现》第十三周学习笔记
第十四章MYSQL实践mysql简介MySQL是一个开源数据库管理系统，由服务器和客户机组成。在将客户机连接到服务器后，用户可向服务器输入SQL命令，以便创建数据库，删除数据库，存储、组织和检索数据库中的数据。MySQL有广泛的应用。mysql安装在ubuntu中使用sudoaptinstallmysql-server......
信息安全系统设计与实现——学习笔记11
任务详情：自学教材，提交学习笔记Part1知识点归纳&GPT提问知识点归纳1.TCP/IP协议TCP/IP协议：TCP代表传输控制协议。IP代表互联网协议。目前有两个版本的IP,即IPv4和IPv6，IPv4使用32位地址，IPv6使用128位地址。TCP/IP各个层级及使用的协议如下图所示：2.IP（1）IP协议ip协议用于在ip......
ShardingSphere学习笔记
MySQL7的root密码校验方式：mysql_native_passwordMySQL8的root密码校验方式：caching_sha2_password将mysql8的root密码校验方式改为7的：ALTERUSER'root'@'%'IDENTIFIEDWITHmysql_native_passwordBY'123456'; 进入docker容器：防止中文显示乱码：dockerexec-itxxx-na......
django学习笔记06 查询
查询库中某个字段的重复值并计数shufareadingcourse.objects.filter(lessonId=targetid[0]['id']).values('qtype').order_by().annotate(count=Count('qtype'))当数据库中有这样的数据，可以看到qtype会有不同类别，但是又会有重复，所以当查询时可以使用这种方式查询到有多少个LETTER......
20231126GESP三级笔记
逛商场点击查看代码#include<bits/stdc++.h>usingnamespacestd;constintN=1e6+10;intn,a[N],x,ans=0;intmain(){cin>>n;for(inti=1;i<=n;i++)cin>>a[i];cin>>x;for(inti=1;i<=n;i++){if(a[i]<=......
学习笔记11
TCP/IP和网络编程一、知识点归纳（一）网络编程简介如今，上网已成为日常生活的需要。虽然大多数人可能只把互联网作为一种信息收集、网上购物和社交媒体等的工具，但计算机科学的学生必须对互联网技术有一定的了解，并掌握一定的网络编程的技能。在本章中，我们将介绍TCP/IP网络和网络编程......

I3D笔记

I3D笔记

工作回顾

Two-Stream Inflated 3D ConvNets

Kinetics

整体架构

相关文章

赞助商

阅读排行