首页 > 其他分享 >使用脚本从HuggingFace镜像站下载模型或数据集

使用脚本从HuggingFace镜像站下载模型或数据集

时间:2024-12-22 17:52:46浏览次数:9  
标签:-- os HuggingFace huggingface download 镜像 HF 下载

在模型训练和部署中,往往会遇到访问HF超时的问题。因此我们常常会提前将模型权重或数据集下载到本地。但相关文件往往比较多,在网页上手动下载太过繁琐。一个一键下载指定HF仓库的脚本就非常实用。

  1. 命令行安装huggingface-cli

pip install -U huggingface_hub

  1. 创建python脚本如下

import os
// 设置环境变量
os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'
// 下载模型
os.system('huggingface-cli download --resume-download HF上的模型名称 --local-dir 本地存放路径')
// 下载数据集
os.system('huggingface-cli download --repo-type dataset --resume-download HF上的数据集名称 --local-dir 本地存放路径')

标签:--,os,HuggingFace,huggingface,download,镜像,HF,下载
From: https://www.cnblogs.com/nancywsn/p/18622335

相关文章

  • 无会员快速下载微云文件
    得益于TX过硬的后台,大家下载微云文件时往往会出现下面的情况无论多好的宽带,依旧会被限制到几十k,下一个文件要一两天,真的是crazy如果想要加速,就不得不买会员,然而即便买了会员,速度可能也只有1M左右实在是良心啊!经过π萌不断地摸索,发现了一个不开会员也能飞速下载的方法,具......
  • docker desktop 需要使用ubantu 子系统,需要在应用商店下载,window打开应用商店无法使用
     解决方案:更新证书。1、以管理员身份打开PowerShell。2、从WindowsUpdate下载根证书更新文件,本示例中文件存储路径c:\roots.sst。certutil-generateSSTFromWUC:\roots.sst3、批量导入证书到受信任根证书。$sstStore=(Get-ChildItem-PathC:\roots.sst)$sstSt......
  • 全网最全,保姆级Stable Diffusion入门使用教程(附模型下载使用说明)
    一、出图的基本操作在出图之前,我们先来了解一下SD操作界面常用的一些功能1、模型选择:选择合适的大模型2、文生图:通过输入提示词,让AI生成图片3、图生图:在已经输入文字指令的基础上,通过一张参考图片,让AI根据提示词生成类似的效果。4、附加功能:提高生成图片的分辨率......
  • docker近期能用的镜像加速器
    加速器地址:https://docker.1ms.run配置方法创建或修改/etc/docker/daemon.json文件{"registry-mirrors":["https://docker.1ms.run"]}加载重启dockersystemctlrestartdocker查看是否成功[root@zabbix-server~]#dockerinfoRegistryMirrors:https://doc......
  • 任意文件下载漏洞分析
    一、漏洞简介​app/adminapi/controller/v1/setting/SystemConfig.php​路由中存在任意文件下载漏洞二、影响版本<=v5.4.0三、环境搭建配置phpstudy,将网站的运行目录,设置在public​目录下设置伪静态四、漏洞原理分析该系统采用前后端分离技术,基于ThinkPHP6+eleme......
  • 国内如何通过 Apple Store 下载 Strava App All In One
    国内如何通过AppleStore下载StravaAppAllInOnesolutionsApple外区账号出国旅游demosStravahttps://www.strava.com/Strava:Run,Bike,Hike4+Track&sharewithfriendshttps://itunes.apple.com/app/strava-cycling/id426826309?mt=8(......
  • 进程内存转储工具|内存镜像提取-取证工具
    1.内存转储,内存转储(MemoryDump)是将计算机的物理内存(RAM)内容复制到一个文件中的过程,这个文件通常被称为“内存转储文件”或“核心转储文件”(CoreDump),内存转储的主要目的是为了调试和分析程序崩溃,系统故障或其他异常情况,通过分析转储文件,开发人员和系统管理员可疑了解在发生问......
  • 计算机毕设项目96xeny5v+python基于python+django的医疗预约与诊断系统,计算机毕业生可
    python基于python+django的医疗预约与诊断系统摘要随着医疗资源的日益紧张,医疗预约与诊断系统的出现成为解决这一问题的关键。该系统旨在提高医疗服务效率,减少患者等待时间,使医疗资源得到更合理的分配。系统利用先进的信息技术,实现了患者在线预约、医生诊断、检查结果的实......
  • AI视频抠图来了!还可以替换视频背景,附下载链接
    虽然人工智能正在飞速发展中,图像处理技术也在不断升级,但视频背景去除一直都是图像处理任务中最具挑战性的难题之一Clipper是一款专注于高精度图像分割的AI工具,用于图像和视频的背景去除,允许用户直接输出透明背景(自定义颜色)的视频文件,还提供用一张图片或者其它视频替换原始视频背......
  • 【智慧化工方案资料】智慧化工园区总体规划设计方案,2024智慧园区项目建设方案,智慧化工
    1、工程概况及建设目标2、项目建设内容3、项目建设各系统方案4、项目建设工期排布软件全套资料部分文档清单:工作安排任务书,可行性分析报告,立项申请审批表,产品需求规格说明书,需求调研计划,用户需求调查单,用户需求说明书,概要设计说明书,技术解决方案,数据库设计说明书,详细设......