文献学习-33-一个用于生成手术视频摘要的python库

时间：2024-04-11 13:32:55浏览次数：32

VideoSum: A Python Library for Surgical Video Summarization

Authors: Luis C. Garcia-Peraza-Herrera, Sebastien Ourselin, and Tom Vercauteren

Source: https://arxiv.org/pdf/2303.10173.pdf

这篇文章主要关注的是如何通过视频摘要来简化和可视化手术视频，以便于数据标注和处理。在这篇文章中，作者提出了一个名为videosum的Python库，可以用来生成手术视频的摘要图片（storyboard）。摘要图片是通过将视频分为一系列表示视频帧的代表图片来创建的。

图1：视频总和时间法制作的手术视频的基线故事板。拼贴下方的条形图代表视频的长度。颜色表示视频帧的簇标签，黑色竖条是关键帧。通过时间方法将视频分割成均匀的时间段。

背景：深度学习算法的表现受到数据的质量和量的影响，但在手术数据科学领域，有限的标注数据使得这一点成为挑战。因此，大量的研究努力在这一领域提出了方法来缓解这一问题。同时，越来越多的计算助手手术数据集正在被发布，尽管该领域的数据规模仍然有限。数据挖掘因此成为许多手术数据科学研究的关键部分。手术视频数据集的处理和可视化是非常挑战性的，因为手术视频的平均时长为130.45分钟。

贡献：这篇文章的贡献包括：

1. 提出了一种易于使用且开源的Python库videosum，可以生成手术视频的摘要图片。
2. 介绍了videosum中四种不同的方法来生成摘要图片：时间、inception、uid三、scda。
3. 提供了如何评估不同方法的方法，即使用Frechet Inception Distance（FID）来比较摘要图片与原始视频之间的分布接近程度。

内容：文章详细描述了每个方法的工作原理，以及它们在不同手术视频上的表现。例如，在inception方法中，每个帧的表示通过使用InceptionV3预训练的深度神经网络得到，并使用该网络的2048元稳定向量作为距离度量。在uid方法中，InceptionV3的稳定向量仍然用于帧的表示，但是采用2-Wasserstein距离作为聚类的度量。在scda方法中，表示帧的方法和距离度量与[5]中提出的方法相同，但是采用INCEPTION的低分辨率稳定向量作为表示图像的描述，并使用2-norm作为聚类的度量。

Reference

[1] Garcia-Peraza, L. C., Ourselin, S., & Vercauteren, T. (2023, July). VideoSum: A Python Library for Surgical Video Summarization. In Conference on New Technologies for Computer and Robot Assisted Surgery 2023.

标签：视频,Python,33,数据,摘要,手术,python,方法
From： https://blog.csdn.net/Metaphysicist/article/details/137632115

批量压缩文件夹里的图片（python）
起源是我收藏了很多照片，但是太大的照片不利于分享使用，而且我并不需要那么高清晰度，通过在线压缩工具tinypng又太慢拥有python下载python教程有很多，但我推荐使用anaconda管理python，可以灵活的管理python版本，还不会导致本地版本冲突压缩脚本安装pillow库，我在pycharm里可以直接......
Python基础语法
1.常用数据类型2.注释单行注释#需要注释的内容多行注释"""需要注释的内容"""3.变量定义变量名=变量值type()查看数据类型type(需查看类型的数据)4.类型转换类型转换代码int(x)#将x转换成整型float(x)#将x转换成浮点型str(x)#将x转换成字......
【python】python根据传入参数不同，调用不同的方法
大家好，我是木头左。今天介绍三种不同方法实现根据传入参数不同，调用不同的方法。使用条件语句在Python中，可以使用条件语句（如if-elif-else语句）来根据传入的参数调用不同的方法。以下是一个示例：defmethod1():print("调用方法1")defmethod2():print("调用方法2")d......
【华为OD】2024年华为OD机试C卷真题集：最新的真题集题库 C/C++/Java/python/JavaScript
【华为OD】2024年C卷真题集：最新的真题集题库C/C++/Java/python/JavaScript【华为OD】2024年C卷真题集：最新的真题集题库C/C++/Java/python/JavaScript-CSDN博客华为OD机试2024年C卷真题题集题库，有2种分数的题目列表，分别是100分的列表、200分的列表需要订阅请看链接：C卷100......
【python基本用法】python的相对引用
要使用__init__.py将mouse_move作为一个包，可以按照以下步骤操作：在包含mouse_move模块的目录中创建一个空的__init__.py文件。这将使Python将该目录视为一个包。在__init__.py文件中，导入mouse_move模块，并将其添加到包中。例如，可以使用以下代码：frommouse_moveimportmouse_mo......
千万不要将centos中python 默认2.7的编译器改为3.x的，会出现File “ usr bin yum“, li
千万不要将centos中python默认2.7的编译器改为3.x的，在使用yum时，会报各种错，1、File"/usr/bin/yum",line30 exceptKeyboardInterrupt,e:原因是yum按python3.6解析2.7的语法出错了修改/usr/bin/yum文件中的第一行为#!/usr/bin/python2.72、 File"/usr/libexec/url......
Python面试50题！面试巩固必看!【转】
题目001:在Python中如何实现单例模式。点评：单例模式是指让一个类只能创建出唯一的实例，这个题目在面试中出现的频率极高，因为它考察的不仅仅是单例模式，更是对Python语言到底掌握到何种程度，建议大家用装饰器和元类这两种方式来实现单例模式，因为这两种方式的通用性最强，而且也可以顺便......
漫谈：编码、哈希、摘要、加密都是什么（别再问“用base64加密行不行”了，会被鄙视）
初级代码游戏的专栏介绍与文章目录-CSDN博客我的github：codetoys，所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。这些代码大部分以Linux为目标但部分代码是纯C++的，可以在任何平台上使用。刚接触加密领域的新手经常搞不清楚这几个概念，这里给大......
基于python数据爬取和可视化
系统介绍本系统介绍了一个基于基于Python的电影数据爬取和可视化技术的研究和方案设计，采用Python语言和Django架构构建。通过网络爬虫爬取豆瓣电影评论数据，利用数据清洗和处理技术，建立了一个全面的电影信息数据库。使用Python中强大的数据处理库进行统计分析，常见的一些库panda......
python-API开发zk客户端
前面于超老师讲完了，zk运维的基本命令行玩法，更多的还是开发需要通过代码和zk结合处理。大多数场景是java后端去操作。这里我们以运维更友好的python来学习。1.kazoo模块zookeeper是一个用于维护配置信息、命名、提供分布式同步和提供组服务。它自身是高可用的，只要宕机节点不......

文献学习-33-一个用于生成手术视频摘要的python库

VideoSum: A Python Library for Surgical Video Summarization

相关文章

赞助商

阅读排行