torch.distributed.DistNetworkError: The server socket has failed to listen on any local network addr

时间：2024-09-20 14:45:19浏览次数：13

标签：socket -- server failed train master

解决方案是在torchrun中添加参数--master_port改变master port。且注意这个参数一定要加在要跑的文件即src/entry_point/train.py之前，否则会被忽略。

引用：https://juejin.cn/post/7260668104752775228

我的代码是：
torchrun --nproc_per_node 1 --master_port 29501 -m training.run --output_dir test_path --model_name_or_path openaccess-ai-collective/tiny-mistral --train_data training/toy_data/toy_data_embedding.jsonl --learning_rate 1e-5 --num_train_epochs 5 --per_device_train_batch_size 2 --dataloader_drop_last True --normalized True --temperature 0.02 --query_max_len 32 --passage_max_len 128 --train_group_size 2 --mode embedding --attn cccc

标签：socket,--,server,failed,train,master
From： https://www.cnblogs.com/chenyi502/p/18422509

数据库数据恢复—SQL Server数据库附加数据库出现823错误，附加失败的数据恢复案例
SQLServer数据库故障：SQLServer附加数据库出现错误823，附加数据库失败。数据库没有备份，无法通过备份恢复数据库。SQLServer数据库出现823错误的可能原因有：数据库物理页面损坏、数据库物理页面校验值损坏导致无法识别该页面、断电或者文件系统问题导致页面丢失。SQLServer数据......
Websocket防护的重要性及应对策略：快快网络专家团队的创新实践
WebSocket（WSS）因其双向和全双工通信的特点，在现代网络通信中得到广泛应用，尤其是在需要低延迟和实时数据交互的场景中。然而，随着WebSocket的普及，其安全性问题也日益凸显，各种针对WSS的攻击手段层出不穷，给企业的数据安全带来了严峻的挑战。针对WSS的攻击具有多样性和隐蔽性。其中，最......
如何解决"Can't connect to MySQL server on 'hostname' (10061)"问题
当遇到"Can'tconnecttoMySQLserveron'hostname'(10061)"这类错误时，通常意味着应用程序无法连接到MySQL数据库服务器。错误代码10061通常表示连接拒绝，可能是因为服务器没有响应或者不允许来自该客户端的连接。以下是解决此类问题的一些步骤：解决方法：检查数据库服务......
【APIM】启用APIM Analytics时遇见Request failed错误
问题描述在APIM页面，查看Analytics的时候显示没有启用数据收集，无法分析。CollectdatafromthisresourceforanalyticsDatacollectionisrequiredfordetailedmonitoring,customdashboards,andmore.ALogAnalyticsworkspaceisalsorequiredforthedatastorage.Y......
C#. 用Winforms连接SQL Server数据库
目录一. 在WinForms应用程序中连接SQLServer，可以按照以下步骤进行：1.创建连接字符串2.使用SqlConnection类创建数据库连接并打开3.SqlCommand类：允许对数据库表做增删改查等操作4.SqlDataReader类：获取查询返回的结果集5.读取完数据后关闭connection的连接二.如果连......
IdentityServer4取消使用HTTPS问题
//Copyright(c)BrockAllen&DominickBaier.Allrightsreserved.//LicensedundertheApacheLicense,Version2.0.SeeLICENSEintheprojectrootforlicenseinformation.usingIdentityModel.Client;usingNewtonsoft.Json.Linq;usingSystem;usin......
# 利刃出鞘_Tomcat 核心原理解析（十一）-- Tomcat 附加功能 WebSocket -- 3
利刃出鞘_Tomcat核心原理解析（十一）--Tomcat附加功能WebSocket–3一、Tomcat专题-WebSocket-案例-OnMessage分析1、WebSocketDEMO案例实现流程分析：OnMessage分析2、在项目dzs168_chat_room中，在websocket类ChatSocket.java中，创建publicvoidonMes......

torch.distributed.DistNetworkError: The server socket has failed to listen on any local network addr

相关文章

赞助商

阅读排行