Hunyuan-DiT环境搭建&推理测试

时间：2024-05-27 09:44:32浏览次数：19

标签：Hunyuan https 模型测试 DiT 搭建推理 HunyuanDiT

引子

最近鹅厂竟然开源了一个多模态的大模型，之前分享福报厂的多模态视觉大模型（Qwen-VL环境搭建&推理测试-CSDN博客）感兴趣的可以移步。鹅厂开源的，我还是头一回部署。好的，那就让我们看看这个多模态视觉大模型有什么特点吧，首先它说它是汉英双语DiT模型，嗯，这个时候必须再次吐槽下智谱开源的CogVLM（CogVLM/CogAgent环境搭建&推理测试-CSDN博客），竟然只支持英文。其次呢，当然是各种测试集的niubility和各种sota，这里就不再赘述。OK，让我们开始吧。

一、环境安装

docker run -it --rm --gpus=all -v /datas/work/zzq:/workspace pytorch/pytorch:1.13.1-cuda11.6-cudnn8-runtime bash

https://github.com/Tencent/HunyuanDiT.git

cd /workspace/HunyuanDiT/HunyuanDiT-main

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

模型下载地址

https://huggingface.co/Tencent-Hunyuan/HunyuanDiT/tree/main

二、推理测试

改为实际路径，防止下载模型

执行

sh test.sh

标签：Hunyuan,https,模型,测试,DiT,搭建,推理,HunyuanDiT
From： https://www.cnblogs.com/nick-algorithmer/p/18214868

内网渗透-隧道搭建
一、前言为什么要进行代理搭建？因为目标主机会把一些可利用的端口给禁了，或者说内网的防火墙不允许这些端口出现，那么这时候就需要搭建一个隧道，什么是隧道，对于小白来说可能有点抽象，其实就是主机与攻击机之间的通讯端口，然后还会设计到端口转发或者是端口映射的问题。端口转发一般发......
YOLOv10 | 手把手教你利用yolov10训练自己数据集（含环境搭建 + 参数解析 + 数据集查找
一、前言本文内含YOLOv10网络结构图+各个创新模块手撕结构图+训练教程+推理教程+ 参数解析+环境搭建+数据集获取等一些有关YOLOv10的内容！目录一、前言二、整体网络结构图三、空间-通道分离下采样3.1SCDown介绍 3.2C2fUIB介绍3.3PSA介绍4.4更......
【MySQL数据库】认识数据库+环境搭建--------Windows系统
一、认识数据库数据库（Database）是按照数据结构来组织、存储和管理数据的仓库。二、MySQL数据库MySQL是一个关系型数据库管理系统，由瑞典MySQLAB公司开发，目前属于Oracle公司。MySQL是一种关联数据库管理系统，关联数据库将数据保存在不同的表中，而不是将所有数据放在一个大......
用github搭建免费的私人图床，白嫖真香
大家好，我是小义。最近在弄个人博客网站，参考了一些前辈们的作品，发现大家存储图片的时候都是用的对外链接，不需要引用图片的相对路径，这样一篇博客文章只需要一个markdown格式的文件来保存就可以了，确实很方便。存放图片的地方就是图床，是一个网络服务，用户在上面上传图片后，可以获......
Blog的图床搭建
本图床搭建基于GitHub+PicGo+jsDelivr本文仅为个人操作方法文章中如有谬误，请多指教1.下载PicGo在PicGO官网下载PicGo2.在GitHub中获取tokens如果你的GitHub中没有repositories或者你想为你的图床创立一个新的repository，请先创建一个新repository并在里面上传图片......
Blog的图床搭建
本图床搭建基于GitHub+PicGo+jsDelivr本文仅为个人操作方法文章中如有谬误，请多指教1.下载PicGo在PicGO官网下载PicGo2.在GitHub中获取tokens如果你的GitHub中没有repositories或者你想为你的图床创立一个新的repository，请先创建一个新repository并在里面上传图片在右侧......
【wiki知识库】01.wiki知识库前后端项目搭建（SpringBoot+Vue3）
......
ADI史上最强的一颗DSP，TS201的开发怎么去做，我来教你入门二：硬件环境的搭建
编者的话TigerSHARC是ADI最早的浮点DSP之一，中文别名虎鲨。本人有幸在2004年接触过一段时间，其“珍稀”程度仅次于ADSP-218X和ADSP-2106X。这个系列的DSP应该是当年的以色列研发团队做的，以性能超强，片上SRAM巨大，以及LINKPORT级联技术和昂贵的售价而著称。很可......
ASP.NET CORE kindeditor在线编辑器示例（上传多图和插入VIDEO标签）
2024年05月26日更新以前记录都过时了，ASP.NETASPX版本的直接看他里面的示例就好，今天把自己弄的上传多图和插入video标签的代码贴上来。。以备以后需要用的时候直接复制粘贴。。。ASP.NETCORE版本，VS2022，原来里面也有个上传多图和插入视频的。。用的flash来上传多图和插入的embe......
[书生·浦语大模型实战营]——第三节：茴香豆：搭建你的 RAG 智能助理
0.RAG概述定义：RAG（RetrievalAugmentedGeneration）技术，通过检索与用户输入相关的信息片段，并结合外部知识库来生成更准确、更丰富的回答。解决LLMs在处理知识密集型任务时可能遇到的挑战,如幻觉、知识过时和缺乏透明、可追溯的推理过程等。提供更准确的回答、降低推理成......

Hunyuan-DiT环境搭建&推理测试

相关文章

赞助商

阅读排行