首页 > 其他分享 >[本科项目实训] HuggingFace简介与Git lfs模型下载

[本科项目实训] HuggingFace简介与Git lfs模型下载

时间:2024-06-23 13:21:41浏览次数:3  
标签:git glm 模型 HuggingFace Git done 实训 lfs 下载

HuggingFace [1]

Hugging Face是一个人工智能领域尤其是自然语言处理领域的开源平台,包含数据集、模型、文档、解决方案等内容的分享。由于 LLM 的参数量较大,往往将参数文件托管到该平台并使用 transformers [3] 库进行模型调用。

模型下载

由于项目要求模型本地运行,因而需要下载模型文件,这里以 ChatGLM 系列为例。

第一步,需要确保当前环境安装了gitgit lfs,安装可以参考如下指令:

# Ubuntu
curl -s https://packagecloud.io/install/repositories/github/git-lfs/script.deb.sh | sudo bash
sudo apt-get install git-lfs
git lfs install
git lfs install

第二步,参考网站对应内容,如[4]:

# <1> Get ALL files
git clone https://huggingface.co/THUDM/glm-4-9b

# <2> If you want to clone without large files - just their pointers
GIT_LFS_SKIP_SMUDGE=1 git clone https://huggingface.co/THUDM/glm-4-9b

# <3> Get pytoch_model_xxxxx.bin
cd your_project_name
git lfs pull --include="*.bin"

第一个方法可以直接下载所有模型文件,包含实现和参数,第二个方法仅下载模型实现,第三个方法仅下载模型参数,如果 git 因网络问题过慢或报错,请尝试代理后重试。执行结果如下所示:

16669@WORKSTATION-HOME MINGW64 /d/Linux_save
$ git clone https://huggingface.co/THUDM/glm-4-9b
Cloning into 'glm-4-9b'...
remote: Enumerating objects: 80, done.
remote: Counting objects: 100% (77/77), done.
remote: Compressing objects: 100% (75/75), done.
remote: Total 80 (delta 36), reused 0 (delta 0), pack-reused 3 (from 1)
Unpacking objects: 100% (80/80), 39.25 KiB | 50.00 KiB/s, done.
Updating files: 100% (24/24), done.

Filtering content: 100% (11/11), 17.51 GiB | 31.42 MiB/s, done.

Filtering content部分给出了参数下载情况。

注:chatglmchatglm2可从 [5] 进行下载。

参考资料

[1] Hugging Face – The AI community building the future.

[2] Huggingface的介绍,使用(CSDN最强Huggingface入门手册)-CSDN博客

[3] Transformers: State-of-the-art Machine Learning for Pytorch, TensorFlow, and JAX.

[4] THUDM/glm-4-9b · Hugging Face

[5] 清华大学云盘 (tsinghua.edu.cn)

标签:git,glm,模型,HuggingFace,Git,done,实训,lfs,下载
From: https://www.cnblogs.com/yichengliu0219/p/18263031

相关文章

  • [本科项目实训] Node.js、npm、pnpm配置及GLIBC_2.28缺失解决方案
    问题描述Node.js是一个基于Google的V8引擎的事件驱动I/O服务端JavaScript环境。以下主要解决在Ubuntu环境中的Node配置问题。解决方案使用node-v可以查看当前的node版本,如果未安装node和npm可以尝试以下指令:aptupdateaptupgradeapt-getinstallnodejsapt-get......
  • 创新实训(七)——比赛(Contest)内部逻辑处理
    比赛部分比赛部分包含比赛列表显示、单个比赛内部信息显示、比赛管理、比赛人员以及比赛报名页面这五个代码主要代码文件。此外在内部逻辑处理时还使用了model和lib下的部分配置代码比赛列表比赛列表包含“正在进行或即将到来的比赛”和“已结束的比赛”这两部分具体代码实现......
  • vscode+picgo+gitee实现Markdown图床
    vscode中编辑Markdown文件,复制的图片默认是保存在本地的。当文档上传csdn时,会提示图片无法识别可以在gitee上创建图床仓库,使用picgo工具上传图片,在Markdown中插入gitee链接的方式来解决该问题。一、安装picgo工具1.1vscode安装picgo插件1.2安装picgo进入PicGo官......
  • 【GitHub从入门到精通】Github如何参与开源贡献:pull request的详细操作流程
    本文深入探讨了如何通过Github的PullRequest功能参与开源项目。文章首先介绍了必要的准备工作,包括创建Github账号和配置SSHKey。接下来,详细描述了从Fork项目到克隆仓库,再到创建新分支、在本地进行更改、提交和推送更改的每一步骤。然后,解释了如何创建和参与PullRequest,并......
  • Gitlab服务器邮箱配置,实现自动为用户发送邮件(注册发送验证链接)
    一.配置前准备工作及说明服务器系统版本:CentOS7postfix,并在终端运行systemctlstatuspostfix检查服务是否已在运行状态,如果显示activate则表示正在运行[root@sage~]$systemctlstatuspostfix●postfix.service-PostfixMailTransportAgentLoaded:loaded(/......
  • CentOS7安装Gitlab13详细步骤
    环境配置CentOS Version7.6GitlabVersiongitlab-ce-13.12.15-ce.0.el7.x86_64下载rpm包Gitlab历史版本下载地址:https://packages.gitlab.com/gitlab/gitlab-ce(我在这里下载的gitlab-ce-13.12.15-ce.0.el7.x86_64.rpm建议使用下载工具进行下载)wgethttps://d20......
  • 大学生必备!GitHub星标破千的matlab教程(从新手到骨灰级玩家)
    MATLAB(MatrixLaboratory)是MathWorks公司推出的用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境的商业数学软件。MATLAB具有数值分析、数值和符号计算、工程与科学绘图、数字图像处理、财务与金融工程等功能,为众多科学领域提供了全面的解决方......
  • GitHub星标破千!斯坦福大学的284个机器学习小抄(漫画中文版)
    说到人工智能必然要了解机器学习,从信息化软件,到电子商务,然后到高速发展互联网时代,到至今的云计算、大数据等,渗透到我们的生活、工作之中,在互联网的驱动下,人们更清晰的认识和使用数据,不仅仅是数据统计、分析,我们还强调数据挖掘、预测。机器学习就是对计算机一部分数据进行学习,......
  • 计算机系统基础实训五—CacheLab实验
    实验目的与要求1、让学生更好地应用程序性能的优化方法;2、让学生更好地理解存储器层次结构在程序运行过程中所起的重要作用;3、让学生更好地理解高速缓存对程序性能的影响;实验原理与内容本实验将帮助您了解缓存对C程序性能的影响。实验由两部分组成。在第一部分中,您将编写......
  • [本科项目实训] 行动模拟实现 与 FastAPI 对应交互-V0
    to2024/06/01行动模拟该项目拟通过大语言模型分析拆解人类描述的任务,自动的调用行动库进行执行并完成内容的汇报。因而需要针对任务对大模型进行微调(比如本项目使用的p-tuningv2),行动模拟即针对微调结果将大模型与行动库进行对接,模拟实际场景下的函数输入输出。第一步,即加......