# 由于我只能访问hugginface网站，但是不能下载里面的数据，所以编写下面的代码，获取从huggingface下载数据的链接。在从其它路径下载数据。

时间：2023-10-24 09:11:24浏览次数：28

标签：pathString huggingface Qwen href link 数据下载

# 由于我只能访问hugginface网站，但是不能下载里面的数据，所以编写下面的代码，获取从huggingface下载数据的链接。在从其它路径下载数据。 # 获取huggingface某个模型所有要下载数据的命令行。 # 可以把结果复制到autodl里，进行执行。速度可以达到13M/s # 然后在autodl里进行训练推理，或者拷贝出来就可以了。
import requests from bs4 import BeautifulSoup
model = "Qwen/Qwen-14B-Chat-Int4" #"Qwen/Qwen-7B-Chat-Int4" #"Qwen/Qwen-7B-Chat" url = 'https://huggingface.co/'+model+'/tree/main' # 替换为要分析的网页URL https://huggingface.co/gpt2/tree/main/onnx startString = "/"+model+"/resolve" pathString = "/"+model+"/tree/main/"
def get_last_part_before_slash(s): # 寻找最后一个斜杠的位置 last_slash_index = s.rfind('/') # 如果找到斜杠，返回斜杠前面的所有字符 if last_slash_index != -1: return s[:last_slash_index] # 如果没有找到斜杠，返回原始字符串 else: return s def getFileListInWebPage(url,startString,pathString): # 发送GET请求获取网页内容 response = requests.get(url) # 使用BeautifulSoup解析网页内容 soup = BeautifulSoup(response.text, 'html.parser') # 查找所有a标签，并提取href属性值 download_links = [] for link in soup.find_all('a'): href = link.get('href') # print(href) if href and (href.startswith(startString) ): # 只保留以xx字母开头的下载链接 download_links.append(href) elif href and (href.startswith(pathString)): url1 = 'https://huggingface.co'+href getFileListInWebPage(url1,startString,pathString)
# 打印所有可下载文件路径 for link in download_links: fileName = link.split('/')[-1] # print("powershell -Command Invoke-WebRequest -Uri \"https://huggingface.co"+link+"\" -OutFile \""+fileName+"\"") # sPath = link.split(pathString)[-1].split('/') sFilePath = get_last_part_before_slash(link.split(pathString)[-1])
print("wget -c \"https://huggingface.co"+link+"\" -P /root/autodl-tmp"+sFilePath)

getFileListInWebPage(url,startString,pathString)

标签：pathString,huggingface,Qwen,href,link,数据,下载
From： https://www.cnblogs.com/tommickey/p/17783948.html

laravel:多mysql数据库(10.27.0 )
一，相关文档https://learnku.com/docs/laravel/10.x/database/14882#2cd405二，php代码1，编辑.envDB_CONNECTION=mysqlDB_HOST=127.0.0.1DB_PORT=3306DB_DATABASE=gonewsDB_USERNAME=yourusernameDB_PASSWORD=yourpasswordCO_DB_CONNECTION=mysqlCO_DB_HOST=127.0.0.1......
linux 中根据指定列的重复次数输出数据
001、按照原始顺序输出[root@pc1test02]#lsa.txt[root@pc1test02]#cata.txt##测试数据a76b78a100c222b7777b8888a9999b3333d1111e7777777e9999999fyyyyy......
华为云服务器+使用本地navcat管理数据库
在开发中，我们需要用数据相关管理软件，来本地管理华为云耀云服务器L实例服务器上的数据库，Navicat 是一款功能强大的数据库管理工具，它具有许多优点，可以帮助数据库管理员和开发人员更轻松地管理数据库。以下是使用 Navicat 软件管理数据库的一些好处：1. 多数据库支持：Navicat......
R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验|附代
全文链接：http://tecdat.cn/?p=32747原文出处：拓端数据部落公众号随着我国经济的快速发展，上市公司的经营绩效成为了一个备受关注的话题。本文旨在探讨上市公司经营绩效的相关因素，并运用数据处理、图示、检验和分析等方法进行深入研究，帮助客户对我国45家上市公司的16项财务指标进行......
tp5 update方法更新数据
thinkphp5的update方法：返回影响数据的条数，没修改任何数据返回0当要更新的数据和已存在数据库的数据一样时,返回的结果为0修改失败返回false所以在判断更新是否成功,要用===的条件进行判断0和false的情况publicfunctionupdate(){ $result=Db::table('User')->w......
机器学习——数据预处理（读这一篇就够了！）
为了能用深度学习来解决现实世界的问题，我们经常从预处理原始数据开始，而不是从那些准备好的张量格式数据开始。下面我们将简要介绍使用pandas预处理原始数据，并将原始数据转换为张量格式的步骤。1.读取数据集举一个例子，我们首先创建一个人工数据集，并存储在CSV（逗号分隔值）文件 .......
数据结构之数组(Java)
一：概述什么是数组呢？数组对应的英文名为array，是有限个相同类型所组成的集合，数组中的每一个变量被称为元素。数组是最为简单、最为常用的数据结构。举例说明：元素31254972索引01234567正如军队里的士兵存在编号一样，数组中的每一个元素也有着自己的小标，这......
openGauss学习笔记-107 openGauss 数据库管理-管理用户及权限-三权分立
openGauss学习笔记-107openGauss数据库管理-管理用户及权限-三权分立默认权限机制和管理员两节的描述基于的是openGauss创建之初的默认情况。从前面的介绍可以看出，默认情况下拥有SYSADMIN属性的系统管理员，具备系统最高权限。在实际业务管理中，为了避免系统管理员拥有过度集中的......
不清除手机数据怎么解锁锁屏密码
不清除手机数据怎么解锁锁屏密码在现代社会中，手机已经成为我们生活中不可或缺的一部分。然而，有时我们可能会遇到忘记锁屏密码的情况，这可能会让我们感到困惑和焦虑。对于那些不希望丢失手机数据的人来说，不清除手机数据来解锁锁屏密码是一个不错的选择。下面我将介绍一些方法来帮......
基于ZCU104的PS和PL数据交互例程（二）：vivado中封装现有工程成IP
基于ZCU104的PS和PL数据交互例程（二）：vivado中封装现有工程成IP设计DUT功能正常创建一个vivado工程，添加一个dut.v的文件功能：读入100个输入数据，每个数据依次加0，1，2，...，然后输出。比如输入是0到99，则输出是0，2，4，到198，如下图所示。状态机：时序图：端口情况：创建vivado工程正常创建新......

# 由于我只能访问hugginface网站，但是不能下载里面的数据，所以编写下面的代码，获取从huggingface下载数据的链接。在从其它路径下载数据。

相关文章

赞助商

阅读排行