首页 > 其他分享 >[Paper Reading] HOIDiffusion: Generating Realistic 3D Hand-Object Interaction Data

[Paper Reading] HOIDiffusion: Generating Realistic 3D Hand-Object Interaction Data

时间:2024-10-23 14:03:06浏览次数:1  
标签:Generating Interaction HOIDiffusion Object Realistic 3D

目录

HOIDiffusion: Generating Realistic 3D Hand-Object Interaction Data

link
时间:24.03
作者与单位:

主页:
https://mq-zhang1.github.io/HOIDiffusion/

TL;DR

一种使用文本与手物3D结构作为输入,对应生成图像的生成算法。

Method


如上图所示,整个过程分为两阶段。

阶段一

将物体3D模型输入GrabNet中生成抓持物体对应的ManoPose轨迹

阶段二

利用轨迹得到的手物3D模型渲染出segmentation map、skeleton map、norm map输入到Diffusion中,再加上Text信息作为Prompt生成各种图像。

Training

既有3D手物模型、又有实际真实背景手物交互图像的HOI数据集太少,直接Finetune容易过拟合。本文在此基础上,使用ChatGPT生成了在各种背景下的"background buffer"(类似下面的Prompt),再将这些"background buffer"的text信息使用现成的text2image算法生成背景。通过这种方式扩充训练时的纯背景数据量,降低过拟合的可能性。

”A hand is grasping a bowl in [background]”

Code && Implementation

The entire training process costs approximately 12 hours on eight A100 GPUs.

Experiment

10min, 效果怎么样?哪些分析实验有启发意义?



Q:表2中PCK的含义?

Furthermore, to evaluate the reinference accuracy, we estimate the MANO parameters of hands in images through a widely used single-view hand pose estimator [48], from which we derive the predicted hand joint positions. The percentage of correct keypoints(PCK) is used to measure the accuracy of predicted keypoints representing the hand poses in our data.

效果可视化


总结与发散

从合成效果来看,保真度还不错,可用来扩充数据丰富度

标签:Generating,Interaction,HOIDiffusion,Object,Realistic,3D
From: https://www.cnblogs.com/fariver/p/18496227

相关文章

  • CS 417/517: Introduction to Human Computer Interaction
    CS417/517:IntroductiontoHumanComputerInteraction Project1(Fall2024)1IntroductionInthisassignment,yourtaskistoimplementaConvolutionalNeuralNetwork(CNN)andevaluatetsperformanceinclassifyinghandwrittendigits.Aftercompleti......
  • 文献阅读笔记|合成医学图像数据综述|Generating Synthetic Data for Medical Imaging
    论文链接:https://doi.org/10.1148/radiol.232471论文信息:GeneratingSyntheticDataforMedicalImaging,综述,2023年9月14日投稿,2024年3月1日接收,2024年9月10日发表于Radiology蓝色字体标注对我而言的新知识目录绪论需求决定合成数据的应用合成数据应具备的特点合成图像的应用1......
  • 【论文阅读笔记】【Hand Pose Estimation-Interacting Hand】 MeMaHand: Exploiting M
    CVPR2023读论文思考的问题论文试图解决什么问题?写作背景是什么?问题:如何在双手识别中集成paramatic(MANO)和non-paramatichand(GCN)representation方法的优点?背景:基于手部模型MANO的方法能够产生合理且稳定的手型,但手部的网格不够细粒度和灵活基于GCN......
  • UML class diagrams and UML interaction diagrams
    Assignment1LearningOutcomes&MaterialsThisassignmentisintendedtodevelopandassessthefollowingunitlearningoutcomes:LO1.Iterativelyapplyobject-orienteddesignprinciplestodesignsmalltomedium-sizesoftwaresystems,usingstandard......
  • Interaction
    这个作业属于哪个课程https://edu.cnblogs.com/campus/fzu/SE2024这个作业要求在哪里https://edu.cnblogs.com/campus/fzu/SE2024/homework/13243这个作业的目标快速上手如何写blog学号082100170Part1Mypurposeistogereratethelogowhichfitmy......
  • Stable Diffusion majicMIX_realistic模型的介绍及使用
    一、简介majicMIX_realistic模型是一种能够渲染出具有神秘或幻想色彩的真实场景的AI模型。这个模型的特点是在现实场景的基础上,通过加入一些魔法与奇幻元素来营造出极具画面效果和吸引力的图像。传统意义的现实场景虽然真实,但通常情况下缺乏奇幻性,而majicMIX_realistic模型就是为了......
  • 多模态学习之论文阅读:《Multi-modal global- and local- feature interaction with at
    《Multi-modalglobal-andlocal-featureinteractionwithattention-basedmechanismfordiagnosisofAlzheimer’sdisease》-2024.9本文提出了一种新的多模态学习框架,用于提高阿尔茨海默病(Alzheimer'sdisease,AD)的诊断准确性。该框架旨在通过结合临床表格数据和大脑......
  • 前端页面:用户交互持续时间跟踪(duration)user-interaction-tracker
    引言在用户至上的时代,精准把握用户行为已成为产品优化的关键。本文将详细介绍user-interaction-tracker库,它提供了一种高效的解决方案,用于跟踪用户交互的持续时间,并提升项目埋点的效率。通过本文,你将了解到如何在Vue、React以及其他框架中使用这个工具,助你更好地理解用......
  • IS论文分享More Than a Bot? The Impact of Disclosing Human Involvement on Custome
    《MoreThanaBot?TheImpactofDisclosingHumanInvolvementonCustomerInteractionswithHybridServiceAgents》,作者是UlrichGnewuch、StefanMorana、OliverHinz、RalfKellner和AlexanderMaedche。文章发表在《InformationSystemsResearch》期刊上,并于2023......
  • zustand Auto Generating Selectors/ts-pattern/swr/TypeScript在monorepo项目中实现
    zustandAutoGeneratingSelectorshttps://docs.pmnd.rs/zustand/guides/auto-generating-selectorsts-pattern替换匹配组件代swrTypeScript在monorepo项目中实现即时更新https://colinhacks.com/essays/live-types-typescript-monorepomonorepodocker项目名:my-project......