首页 > 其他分享 >在 hf 上下载指定仓库的指定文件

在 hf 上下载指定仓库的指定文件

时间:2024-11-05 19:32:06浏览次数:1  
标签:文件 仓库 指定 huggingface -- include hf 下载

Hugging Face CLI 的 --include 命令使用指南

理解 --include 命令

在 Hugging Face CLI 中,--include 参数用于指定要下载的文件或文件夹的模式。它通常与正则表达式配合使用,以灵活地筛选出所需的文件。

使用方式

huggingface-cli download <仓库名称> --include <模式>
  • <仓库名称>: 你想要下载文件的 Hugging Face 仓库名称。
  • <模式>: 一个正则表达式,用来匹配要下载的文件名。

示例

假设你想要从仓库 datasets/squad 中下载所有以 .json 结尾的文件:

huggingface-cli download datasets/squad --include "*.json"

这将会下载该仓库中所有满足 .json 模式(即文件名以 .json 结尾)的文件。

高级用法

  • 多个模式: 可以使用逗号分隔多个模式:
huggingface-cli download my-repo --include "*.txt,*.csv"
  • 排除文件: 使用 --exclude 参数来排除某些文件:
huggingface-cli download my-repo --include "*.py" --exclude "__init__.py"
  • 递归下载: 如果仓库中有子目录,可以使用 -r--recursive 参数递归下载:
huggingface-cli download my-repo -r --include "*.json"

常见正则表达式

  • .:匹配任意单个字符。
  • *:匹配零个或多个任意字符。
  • ?:匹配零个或一个任意字符。
  • [abc]:匹配方括号中的任意一个字符。
  • [^abc]:匹配不在方括号中的任意一个字符。

注意

  • 正则表达式语法: 正则表达式的语法比较灵活,但也有其特定的规则。你可以查阅相关资料深入学习。
  • 仓库结构: 不同的仓库文件结构可能不同,你需要根据具体情况调整模式。
  • 性能: 下载大量文件可能需要较长时间,请耐心等待。

示例:下载 Qwen 模型的部分文件

假设你想要下载 Qwen/Qwen2.5-14B-Instruct-GGUF 仓库中以 qwen2.5-14b-instruct-q8_0-0000[1-4]-of-00004.gguf 模式命名的文件,你可以使用以下命令:

huggingface-cli download Qwen/Qwen2.5-14B-Instruct-GGUF --include "qwen2.5-14b-instruct-q8_0-0000[1-4]-of-00004.gguf"

这个命令会下载该仓库中符合模式的所有文件。

总结

--include 参数为我们提供了强大的文件筛选功能,可以根据我们的需求灵活地下载 Hugging Face 仓库中的文件。通过掌握正则表达式,我们可以实现更加复杂的下载任务。

更多帮助

如果你需要更详细的帮助,可以查阅 Hugging Face CLI 的官方文档:https://huggingface.co/docs/huggingface_hub/guides/cli

标签:文件,仓库,指定,huggingface,--,include,hf,下载
From: https://www.cnblogs.com/litifeng/p/18528653

相关文章

  • ”​​启动C:\Windows\System32\logiLDA.DLL时出现问题,找不到指定模块​“故障处置
    问题描述:WIN10升级出现下面错误信息启动C:\Windows\System32\logiLDA.DLL时出现问题,找不到指定模块解决办法:1.运行win+r、输入regedit2.找到HKEY_LOCAL_MACHINE\Software\Microsoft\Windows\CurrentVersion\Run目录下的LogitechDownloadAssistant3.右键删除即可......
  • 用Powershell控制指定进程窗口的位置和大小
    用Powershell控制CMD窗口的位置和大小我想控制下面这段bat代码执行时,窗口的位置和大小,里面其实是ps代码,存成bat格式#@&cls&powershell"type'%~0'|out-string|iex"&pause&exit"hello,world"cmd/cpauseCOPY我在国外找到了一个ps函数,他可以控制某个窗口的位置和大小,......
  • 批量删除word文件指定页
     环境准备:系统    Windows语言Python3.8开发工具Pycharmimportosimportcomtypes.clientdefdelete_first_page(doc_path):#获取Word应用程序对象word=comtypes.client.CreateObject('Word.Application')word.Visible=0#不可见doc=w......
  • 如何使用git将自己的代码上传到别人的gitee仓库
    1、git与gitee的关系1.Git是版本控制系统,它是一个本地工具,用于在开发者的计算机上跟踪和管理代码的历史记。2.Gitee是一个基于云的平台,类似于GitHub,它托管了数百万个Git存储库,开发者可以将他们的Git项目上传到Gitee以与其他人共享和协作。Gitee提供了一个可视化的界面和一......
  • 【数据仓库】
    1、概述数据仓库,英文名称为DataWarehouse,可简写为DW或DWH。数据仓库是企业中用于集中存储和管理来自多个源的经过处理和组织的数据的系统。它为复杂的查询和分析提供了一个优化的环境,使得用户能够执行高级数据分析,以支持商业决策。数据在进入仓库之前经过清洗、转换和集......
  • ❌ NoSuchFieldException:类中不存在此字段的完美解决方法
    ❌NoSuchFieldException:类中不存在此字段的完美解决方法......
  • uniapp使用uni.createInnerAudioContext()播放指定音频并且切换
    uniapp使用uni.createInnerAudioContext()播放指定音频并且切换因为做的小程序或者h5需要视频讲解或者音乐组件的默认展示播放按钮,当点击播放的时候显示暂停音乐这样的一个效果。在unipp中我们直接只用uni.createInnerAudioContext()代替audio,使用更加方便,更加简洁,unia......
  • Docker仓库之Registry私有镜像仓库的搭建与使用
    本章将和大家分享Docker仓库之Registry私有镜像仓库的搭建与使用。废话不多说,下面我们直接进入主题。一、官方标配:Registry私有镜像仓库DockerHub作为Docker默认官方公共镜像仓库,如果想要自己搭建私有镜像仓库,官方也提供了Registry镜像,使得我们搭建私有仓库变得非常简单。所谓......
  • CentOS基于nginx构建本地YUM仓库
    #0.开启yum下载缓存sed-i'3ckeepcache=1'/etc/yum.conf#1.安装插件yuminstall-yyum-plugin-downloadonlycreatereporsync#2.创建仓库目录mkdir-p/mirrors/centos#3.下载文件或上传文件yuminstallnginx-y--downloadonly--downloaddir=/mirrors/centos#只下载......
  • docker bulid tag push到自己的docker hub 仓库
      -t(或 --tag)参数:用于给构建的镜像指定标签(tag)。标签的格式通常是 [仓库名/][用户名/]镜像名:版本号-f(或 --file)参数: 指定构建镜像所使用的 Dockerfile 的路径。默认情况下,dockerbuild 会在当前目录下查找名为 Dockerfile 的文件,但通过这个参数可以指定其他位......