在 GpuMall 平台使用该功能可以在实例启动的同时自动帮您拉起进程或者任务,该功能主要适用于以下场景:
立即免费体验:https://gpumall.com/login?type=register&source=cnblogs
实例开机即启动您需要的进程。
推理任务,比如您需要扩容某个功能节点,只需要创建实例即可自动拉起您的推理任务,来接收请求。
特定的Web项目,比如 Stable Diffusion web UI。
Job任务制项目,开启实例后及运行,然后配合平台的定时关机功能来实现任务结束即关机。
特定的训练场景或某些监控任务。
该功能必须在创建实例的时候指定要运行的命令#autodl#恒源云#矩池云#算力云#恒源云 实例迁移#autodl 官网#autodi#GpuMall#GPU云#AutoDL#AotuDL 算力云#GpuMall智算云#AI#大数据#算力租赁#大模型#深度学习#人工智能#算力变现
下面演示以下几种对于该功能的用法
实例启动时拉起一个官方镜像中已存在的项目
实例启动时拉起一个训练项目
实例启动时拉起一个推理项目
实例启动时拉起一个脚本来同时拉起多个项目
实例启动时拉起一个 Web 项目,拉起后直接公网访问
- 实例启动时拉起一个官方镜像中已存在的项目
进入 GpuMall控制台 去创建实例,选择实例镜像,展开高级配置,填写入口命令,该入口命令即为实例启动同时会执行的任务,我这里选择的为官方镜像。
python -m http.server 8080
选择完成后点击右下角的【创建实例】
- 登录实例
可以通过控制台中对应实例的 JupyterLab 点击进去,打开终端查看
或者通过 SSH登录实例 方式进入实例
- 验证进程是否拉起 通过 ps aux | grep [进程名称] 来获取是否拉起进程
注意
验证无误后,该实例的每次启动都会拉起 python -m http.server 8080 这个任务,如果 python -m http.server 8080 任务执行失败,也不会影响实例正常启动。
- 实例启动时拉起一个训练项目
提示
默认情况下使用官方镜像是没有您需要训练的项目,正确的做法应该按照如下流程:
使用官方镜像创建一台实例。
进入实例准备训练代码。
实例关机-》实例管理-》更多-》备份镜像。
使用备份镜像去创建实例-》高级配置-》入口命令-》指定实例启动时需要拉起的训练任务。
创建实例-》进入实例验证是否在训练。
3. 实例启动时拉起一个推理项目
提示
默认情况下使用官方镜像是没有您的推理项目,正确的做法应该按照如下流程:
使用官方镜像创建一台实例。
进入实例准备您的推理项目和数据,如果在没有网盘的数据中心则需要把数据存在系统盘。
实例关机-》实例管理-》更多-》备份镜像。
使用备份镜像去创建实例-》高级配置-》入口命令-》指定实例启动时需要拉起的推理任务。
创建实例-》进入实例验证推理任务是否已拉起。
4. 实例启动时拉起一个脚本来同时拉起多个项目
提示
默认情况下使用官方镜像是没有您要拉起的脚本,正确的做法应该按照如下流程:
使用官方镜像创建一台实例。
进入实例准备您需要拉起的脚本,以及脚本内容中需要拉起的任务,脚本中如果有多个任务需要拉起,则最后一个任务前的所有任务需要通过 nohup 来后台运行。
实例关机-》实例管理-》更多-》备份镜像。
使用备份镜像去创建实例-》高级配置-》入口命令-》指定实例启动时需要拉起的脚本。
创建实例-》进入实例验证是否已拉起脚本并且脚本中的任务是否拉起。
5. 实例启动时拉起一个 Web 项目进行
提示
默认情况下使用官方镜像是没有您要拉起的 Web 项目,正确的做法应该按照如下流程:
使用官方镜像创建一台实例。
进入实例准备您需要拉起的 Web 项目,手动测试 Web 项目是否可以正常启动。
实例关机-》实例管理-》更多-》备份镜像。
使用备份镜像去创建实例-》高级配置-》入口命令-》指定实例启动时需要拉起的 Web 项目。
创建实例-》进入实例验证是否已拉起您指定的 Web 项目。