首页 > 其他分享 ># 由于我只能访问hugginface网站,但是不能下载里面的数据,所以编写下面的代码,获取从huggingface下载数据的链接。在从其它路径下载数据。

# 由于我只能访问hugginface网站,但是不能下载里面的数据,所以编写下面的代码,获取从huggingface下载数据的链接。在从其它路径下载数据。

时间:2023-10-24 09:11:24浏览次数:28  
标签:pathString huggingface Qwen href link 数据 下载

# 由于我只能访问hugginface网站,但是不能下载里面的数据,所以编写下面的代码,获取从huggingface下载数据的链接。在从其它路径下载数据。 # 获取huggingface某个模型所有要下载数据的命令行。 # 可以把结果复制到autodl里,进行执行。速度可以达到13M/s # 然后在autodl里进行训练推理,或者拷贝出来就可以了。
import requests   from bs4 import BeautifulSoup  
model = "Qwen/Qwen-14B-Chat-Int4" #"Qwen/Qwen-7B-Chat-Int4" #"Qwen/Qwen-7B-Chat" url = 'https://huggingface.co/'+model+'/tree/main'  # 替换为要分析的网页URL  https://huggingface.co/gpt2/tree/main/onnx startString = "/"+model+"/resolve" pathString = "/"+model+"/tree/main/"
def get_last_part_before_slash(s):       # 寻找最后一个斜杠的位置       last_slash_index = s.rfind('/')       # 如果找到斜杠,返回斜杠前面的所有字符       if last_slash_index != -1:           return s[:last_slash_index]       # 如果没有找到斜杠,返回原始字符串       else:           return s       def getFileListInWebPage(url,startString,pathString):     # 发送GET请求获取网页内容           response = requests.get(url)           # 使用BeautifulSoup解析网页内容       soup = BeautifulSoup(response.text, 'html.parser')           # 查找所有a标签,并提取href属性值       download_links = []       for link in soup.find_all('a'):           href = link.get('href')           # print(href)         if href and (href.startswith(startString) ):  # 只保留以xx字母开头的下载链接             download_links.append(href)         elif href and (href.startswith(pathString)):             url1 = 'https://huggingface.co'+href             getFileListInWebPage(url1,startString,pathString)
        # 打印所有可下载文件路径       for link in download_links:           fileName = link.split('/')[-1]         # print("powershell -Command Invoke-WebRequest -Uri \"https://huggingface.co"+link+"\" -OutFile \""+fileName+"\"")         # sPath = link.split(pathString)[-1].split('/')         sFilePath = get_last_part_before_slash(link.split(pathString)[-1])
        print("wget -c \"https://huggingface.co"+link+"\" -P /root/autodl-tmp"+sFilePath)

getFileListInWebPage(url,startString,pathString)

标签:pathString,huggingface,Qwen,href,link,数据,下载
From: https://www.cnblogs.com/tommickey/p/17783948.html

相关文章

  • laravel:多mysql数据库(10.27.0 )
    一,相关文档https://learnku.com/docs/laravel/10.x/database/14882#2cd405二,php代码1,编辑.envDB_CONNECTION=mysqlDB_HOST=127.0.0.1DB_PORT=3306DB_DATABASE=gonewsDB_USERNAME=yourusernameDB_PASSWORD=yourpasswordCO_DB_CONNECTION=mysqlCO_DB_HOST=127.0.0.1......
  • linux 中根据指定列的重复次数输出数据
     001、按照原始顺序输出[root@pc1test02]#lsa.txt[root@pc1test02]#cata.txt##测试数据a76b78a100c222b7777b8888a9999b3333d1111e7777777e9999999fyyyyy......
  • 华为云服务器+使用本地navcat管理数据库
     在开发中,我们需要用数据相关管理软件,来本地管理华为云耀云服务器L实例服务器上的数据库,Navicat 是一款功能强大的数据库管理工具,它具有许多优点,可以帮助数据库管理员和开发人员更轻松地管理数据库。以下是使用 Navicat 软件管理数据库的一些好处:1. 多数据库支持:Navicat......
  • R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验|附代
    全文链接:http://tecdat.cn/?p=32747原文出处:拓端数据部落公众号随着我国经济的快速发展,上市公司的经营绩效成为了一个备受关注的话题。本文旨在探讨上市公司经营绩效的相关因素,并运用数据处理、图示、检验和分析等方法进行深入研究,帮助客户对我国45家上市公司的16项财务指标进行......
  • tp5 update方法更新数据
    thinkphp5的update方法:返回影响数据的条数,没修改任何数据返回0当要更新的数据和已存在数据库的数据一样时,返回的结果为0修改失败返回false所以在判断更新是否成功,要用===的条件进行判断0和false的情况publicfunctionupdate(){ $result=Db::table('User')->w......
  • 机器学习——数据预处理(读这一篇就够了!)
    为了能用深度学习来解决现实世界的问题,我们经常从预处理原始数据开始,而不是从那些准备好的张量格式数据开始。 下面我们将简要介绍使用pandas预处理原始数据,并将原始数据转换为张量格式的步骤。1.读取数据集举一个例子,我们首先创建一个人工数据集,并存储在CSV(逗号分隔值)文件 .......
  • 数据结构之数组(Java)
    一:概述什么是数组呢?数组对应的英文名为array,是有限个相同类型所组成的集合,数组中的每一个变量被称为元素。数组是最为简单、最为常用的数据结构。举例说明:元素31254972索引01234567正如军队里的士兵存在编号一样,数组中的每一个元素也有着自己的小标,这......
  • openGauss学习笔记-107 openGauss 数据库管理-管理用户及权限-三权分立
    openGauss学习笔记-107openGauss数据库管理-管理用户及权限-三权分立默认权限机制和管理员两节的描述基于的是openGauss创建之初的默认情况。从前面的介绍可以看出,默认情况下拥有SYSADMIN属性的系统管理员,具备系统最高权限。在实际业务管理中,为了避免系统管理员拥有过度集中的......
  • 不清除手机数据怎么解锁锁屏密码
    不清除手机数据怎么解锁锁屏密码在现代社会中,手机已经成为我们生活中不可或缺的一部分。然而,有时我们可能会遇到忘记锁屏密码的情况,这可能会让我们感到困惑和焦虑。对于那些不希望丢失手机数据的人来说,不清除手机数据来解锁锁屏密码是一个不错的选择。下面我将介绍一些方法来帮......
  • 基于ZCU104的PS和PL数据交互例程(二):vivado中封装现有工程成IP
    基于ZCU104的PS和PL数据交互例程(二):vivado中封装现有工程成IP设计DUT功能正常创建一个vivado工程,添加一个dut.v的文件功能:读入100个输入数据,每个数据依次加0,1,2,...,然后输出。比如输入是0到99,则输出是0,2,4,到198,如下图所示。状态机:时序图:端口情况:创建vivado工程正常创建新......