首页 > 其他分享 >服务器从hugging face下载数据集失败

服务器从hugging face下载数据集失败

时间:2024-06-17 17:32:31浏览次数:19  
标签:load val jsonl hugging dataset 服务器 face

问题

服务器没法下载外网数据导致hugging face的load_dataset下载失败。

解决方法

没找到load_dataset的源代码,想办法本地下载并上传到服务器,服务器从本地使用数据集。
示例:dataset = load_dataset("mit-han-lab/pile-val-backup", split="validation")
将该路径下的文件下载到本地。

显然只有val.jsonl.zst是数据集文件。
通过其文件类型为jsonl,查看load_dataset怎么load jsonl文件。
load方式为dataset = load_dataset("json", data_files="path_to_jsonl")
但还是会报错,经过多次print dataset发现
dataset = load_dataset("mit-han-lab/pile-val-backup", split="validation")
等价于
dataset = load_dataset("json", data_files="val_data/val.jsonl")
dataset = dataset['train']

标签:load,val,jsonl,hugging,dataset,服务器,face
From: https://www.cnblogs.com/xzh-personal-issue/p/18252874

相关文章

  • 处理问题:windows server 2016由于没有远程桌面授权服务器可以提供许可证,远程会话被中
      windowsserver可以多用户同时登陆,默认最大远程登录数量为2,如果有更多人需要同时远程登录,则需要安装远程桌面授权服务,第一次安装后,免费期为120天,超过则无法正常远程登录。解决办法如下:Windowsserver2016服务器远程桌面登录时出现错误提示:“由于没有远程桌面授权服务器......
  • jenkins slave节点上的job构建记录 都只会在master服务器
    在Jenkins中,构建记录(BuildRecords)通常会保存在Jenkins的主节点(Master)上,而不是在从节点(Slave)上。这是因为主节点是整个Jenkins实例的中心控制点,负责管理和调度构建任务,包括记录和跟踪构建历史、日志和报告。 当从节点执行构建任务时,它会将构建的输出、日志和其他相关信......
  • 京准电钟 | GPS北斗卫星授时服务器的操作指南是什么?
    京准电钟|GPS北斗卫星授时服务器的操作指南是什么?京准电钟|GPS北斗卫星授时服务器的操作指南是什么?京准电子科技官微——ahjzsz1、连接天线天线连接到“ANT”口。2、连接电源将220V电源线连到AC220V座上或将电源适配器(7.5V~12V)接到DC口上。也可以同时接上,提高供电可靠......
  • [0基础]如何搭建一个cs2d的服务器
    前言想要开一台24小时不间断的cd2d服务器?官方教程有些含糊?跟着教程来,包你学会看清标题,不是cs2,是cs2d!前期准备工作首先你需要一台云服务器或虚拟主机(如果自己有一台物理服务器,自行在目录中跳转相关内容)这里推荐雨云的美国洛杉矶极速二区【别问为什么不选延迟更低的香......
  • Ubuntu server 24 (Linux) 安装部署samba服务器 共享文件目录 windows访问
    1安装sudoaptupdatesudoapt-getinstallsamba#启动服务sudosystemctlrestartsmbd.servicesudosystemctlenablesmbd.service#查看服务2创建用户#创建系统用户sudouseraddtest2#配置用户密码sudosmbpasswd-atest2#smbpasswd:-a添加用户-......
  • 弹性云服务器大揭秘:快快云4核8G仅需98元,高性价比之选!
    随着数字化时代的到来,企业对灵活、高效且稳定的云服务需求日益增长。在这一背景下,弹性云服务器凭借其卓越的性能和灵活性,成为了众多企业的首选。今天,我们就来聊聊弹性云服务器的优势,并特别推荐一款性价比极高的产品——快快弹性云服务器。一、什么是弹性云服务器?弹性云服务......
  • 服务器(RAID)数据丢失了如何恢复?
    服务器是重中之重,数据丢失会造成巨大损失。服务器数据丢失了还能恢复吗?如何恢复丢失的数据?服务器数据丢失了还能恢复?服务器数据恢复是指将物理服务器或虚拟服务器上丢失的数据重现还原的操作。随着信息化的深入,企事业单位大都会配备服务器,方便数据集中存储管理,建立自己的信息......
  • MySQL之优化服务器设置(五)
    优化服务器设置高级InnoDB设置innodb_old_blocks_timeInnoDB有两段缓冲池LRU(最近最少使用)链表,设计目的是防止换出长期很多次的页面。像mysqldump产生的这种一次性的(大)查询,通常会读取页面到缓冲池的LRU列表,从中读取需要的行,然后移动到下一页。理论上,两段LRU链表将阻止......
  • 安装ZLMediaKit流媒体服务器
    1安装ZLMediaKit#更新安装源sudoapt-getupdate#安装编译器sudoapt-getinstallbuild-essential#安装cmakesudoapt-getinstallcmake#安装依赖库(必选)sudoapt-getinstalllibssl-dev#安装依赖库(可选)sudoapt-getinstallffmpegsudoapt-getinstalll......
  • WIndow Server 2019 服务器 MinIO下载并IIS配置反向代理
    1、官网下载并配置下载MinIOServe地址(不需要安装,放在目录就行)https://dl.min.io/server/minio/release/windows-amd64/minio.exe设置账号和密码(cmd)setxMINIO_ROOT_USERadminsetxMINIO_ROOT_PASSWORD123456+++运行程序(添加文件minio.bat并运行)@echooffsetpath=C:\mi......