首页 > 其他分享 >torch.distributed.DistNetworkError: The server socket has failed to listen on any local network addr

torch.distributed.DistNetworkError: The server socket has failed to listen on any local network addr

时间:2024-09-20 14:45:19浏览次数:8  
标签:socket -- server failed train master

解决方案是在torchrun中添加参数--master_port改变master port。且注意这个参数一定要加在要跑的文件即src/entry_point/train.py之前,否则会被忽略。

引用:https://juejin.cn/post/7260668104752775228

我的代码是:
torchrun --nproc_per_node 1 --master_port 29501 -m training.run --output_dir test_path --model_name_or_path openaccess-ai-collective/tiny-mistral --train_data training/toy_data/toy_data_embedding.jsonl --learning_rate 1e-5 --num_train_epochs 5 --per_device_train_batch_size 2 --dataloader_drop_last True --normalized True --temperature 0.02 --query_max_len 32 --passage_max_len 128 --train_group_size 2 --mode embedding --attn cccc

标签:socket,--,server,failed,train,master
From: https://www.cnblogs.com/chenyi502/p/18422509

相关文章

  • 数据库数据恢复—SQL Server数据库附加数据库出现823错误,附加失败的数据恢复案例
    SQLServer数据库故障:SQLServer附加数据库出现错误823,附加数据库失败。数据库没有备份,无法通过备份恢复数据库。SQLServer数据库出现823错误的可能原因有:数据库物理页面损坏、数据库物理页面校验值损坏导致无法识别该页面、断电或者文件系统问题导致页面丢失。SQLServer数据......
  • Websocket防护的重要性及应对策略:快快网络专家团队的创新实践
    WebSocket(WSS)因其双向和全双工通信的特点,在现代网络通信中得到广泛应用,尤其是在需要低延迟和实时数据交互的场景中。然而,随着WebSocket的普及,其安全性问题也日益凸显,各种针对WSS的攻击手段层出不穷,给企业的数据安全带来了严峻的挑战。针对WSS的攻击具有多样性和隐蔽性。其中,最......
  • 如何解决"Warning: include(): Failed opening 'file_path' for inclusion"问题
    解决方法检查文件路径确认文件路径是否正确无误,包括路径中的每个目录和文件名。验证文件是否存在使用file_exists()函数检查文件是否真的存在于指定路径上。检查文件权限确认文件具有足够的权限供当前用户读取。可以使用chmod命令修改文件权限:bash chmod......
  • 如何解决"Can't connect to MySQL server on 'hostname' (10061)"问题
    当遇到"Can'tconnecttoMySQLserveron'hostname'(10061)"这类错误时,通常意味着应用程序无法连接到MySQL数据库服务器。错误代码10061通常表示连接拒绝,可能是因为服务器没有响应或者不允许来自该客户端的连接。以下是解决此类问题的一些步骤:解决方法:检查数据库服务......
  • 【APIM】启用APIM Analytics时遇见Request failed错误
    问题描述在APIM页面,查看Analytics的时候显示没有启用数据收集,无法分析。CollectdatafromthisresourceforanalyticsDatacollectionisrequiredfordetailedmonitoring,customdashboards,andmore.ALogAnalyticsworkspaceisalsorequiredforthedatastorage.Y......
  • 【APIM】启用APIM Analytics时遇见Request failed错误
    问题描述在APIM页面,查看Analytics的时候显示没有启用数据收集,无法分析。CollectdatafromthisresourceforanalyticsDatacollectionisrequiredfordetailedmonitoring,customdashboards,andmore.ALogAnalyticsworkspaceisalsorequiredforthedatastor......
  • C#. 用Winforms连接SQL Server数据库
    目录一. 在WinForms应用程序中连接SQLServer,可以按照以下步骤进行:1.创建连接字符串2.使用SqlConnection类创建数据库连接并打开3.SqlCommand类:允许对数据库表做增删改查等操作4.SqlDataReader类:获取查询返回的结果集5.读取完数据后关闭connection的连接二.如果连......
  • IdentityServer4取消使用HTTPS问题
    //Copyright(c)BrockAllen&DominickBaier.Allrightsreserved.//LicensedundertheApacheLicense,Version2.0.SeeLICENSEintheprojectrootforlicenseinformation.usingIdentityModel.Client;usingNewtonsoft.Json.Linq;usingSystem;usin......
  • # 利刃出鞘_Tomcat 核心原理解析(十一)-- Tomcat 附加功能 WebSocket -- 3
    利刃出鞘_Tomcat核心原理解析(十一)--Tomcat附加功能WebSocket–3一、Tomcat专题-WebSocket-案例-OnMessage分析1、WebSocketDEMO案例实现流程分析:OnMessage分析2、在项目dzs168_chat_room中,在websocket类ChatSocket.java中,创建publicvoidonMes......
  • 升讯威在线客服系统如何高性能同时支持 MySQL 和 SQL Server
    升讯威在线客服与营销系统是基于.netcore/WPF开发的一款在线客服软件,宗旨是:开放、开源、共享。努力打造.net社区的一款优秀开源产品。前段时间我发表了一系列文章,开始介绍基于.netcore的升讯威在线客服系统开发过程。随时Linux+MySQL的广泛应用,必须让系统同时支......