首页 > 其他分享 >AI-Station使用教程

AI-Station使用教程

时间:2024-03-22 10:15:04浏览次数:20  
标签:web 教程 AI 创建 点击 Station 镜像 页面 加速卡

一、创建用户

用户管理-创建用户:

1.  在ai-station的web页面上登录管理员的账号:admin,密码:123456Aaa?

2.  点击系统管理 -> 用户管理 ->创建 -> 再次输入密码:123456Aaa?

3.  创建普通用户:账户和姓名必须一致(自定义设置)->选取iei 用户组 -> 点击确定

4.  设置配额:为了后续长久使用方便,都选取无限制

5.  再次进入ai-station的web页面上登录自己设置的账号,首次登录密码默认:123456a?,登录后自己可以修改密码

 

二、文件管理:

文件管理 第一次创建文件时,建议从自己所用的服务器中拷贝到集群管理节点的服务器以下是步骤(案例):
1. 登录集群服务器
    从ssh中连接:ip地址:172.16.80.11,端口:22,账号:root  密码:Ais123456#123
    绝对路径进入自己的家目录下:cd /mnt/inaisfs/user-fs,mkdir创建自己的目录
2. 传输数据(进入自己的用的服务器,将代码,模型,日志,数据等等都放到一个文件夹下)
     命令scp -r tf_kir_subtyping_prediction [email protected]1:/mnt/inaisfs/user-fs/aaa/  
     密码:Ais123456#123
3. 登录web页面的ai-station,地址:https://172.16.80.11:3206
    选取文件管理->用户目录,可以看到自己拷贝的文件夹
    后续如果修改代码,可以直接在ai-station的web页面下打开自己的py文件,修改完保存就行

 

三、业务管理->开发环境

业务管理时,创建开发环境:

1.不选外部镜像
2.选pytorch,镜像是pytorch_new:v1.2
3.资源组:kir_pretrain
4.网络类型:ib
5.加速卡系列:GPU
6.加速卡类型L40S
7.CPU/加速卡:选取自定义:      CPU:随意设置,最大192,加速卡:随意设置,最大8卡
8.点击确定。等待加载好镜像后,进入镜像点击shell页面,就可以开始测试了

 

四、业务管理->任务管理

任务管理-创建任务:
1.不选外部镜像
2.选pytorch,镜像是pytorch_new:v1.2
3.部署类型是:MPI,worker是8,不选弹性任务
4.训练任务的命令行:cd /zzj/deepspeed-test && bash -x start_deep.sh 
5.资源组:kir_pretrain
6.网络类型:ib
7.加速卡系列:GPU
8.加速卡类型L40S
9.CPU/加速卡:选取自定义:      CPU:128核,加速卡:8
10.点击确定

for i in `seq 1 8`;do ssh l40s$i nvidia-smi;done  查看集群显卡的nvidia-smi

注意重点是设置start_deep.sh 和 deepseed_env,下面的bash脚本内是有对应的start_deepspeed和deepspeed_env

start_deepspeed.sh

脚本内设置的多机多卡deepspeed的参数实例:kir_ai_station.py

配置文件:

kir_ds_config.json

 

五、镜像管理

镜像管理-创建镜像:
1.  在web页面中登录自己的账号密码,点击镜像管理,导出该镜像172.16.80.1:5000/other/basic
2.  点击业务管理->开发环境->创建环境 (和前面创建环境一样的操作,只是将pytorch_zzj_new-zzj:v1.2换成172.16.80.1:5000/other/basic)
3.  然后就是创建conda环境,安装各种包,安装完成后,点击右上角保存镜像(设置镜像名称)
4.  然后点击镜像管理,导出刚刚保存的镜像,就可以正常使用了

 

六、资源管理

资源管理-创建资源组:
1.  在web页面中登录管理员的账号密码,点击资源管理->资源组->创建
2.  选取通用->设置名称->设置节点->共享属性选取共享->点击确定

标签:web,教程,AI,创建,点击,Station,镜像,页面,加速卡
From: https://www.cnblogs.com/likecoke/p/18088806

相关文章

  • 一线大厂面试真题——fail-safe机制与fail-fast机制分别有什么作用
    fail-safe和fail-fast,是多线程并发操作集合时的一种失败处理机制。Fail-fast:表示快速失败,在集合遍历过程中,一旦发现容器中的数据被修改了,会立刻抛出ConcurrentModificationException异常,从而导致遍历失败,像这种情况(贴下面这个图)。定义一个Map集合,使用Iterator迭代器进行数......
  • PHP+MySQL开发组合:智慧同城便民信息小程序源码系统 带完整的安装代码包以及安装部署教
    当前,城市生活的节奏日益加快,人们对各类便民信息的需求也愈发迫切。无论是寻找家政服务、二手交易,还是发布租房、求职信息,一个高效、便捷的信息平台显得尤为重要。传统的信息发布方式往往存在信息更新不及时、查找困难等问题,无法满足现代都市人的需求。罗峰给大家分享一款智慧同......
  • 新能源汽车充电桩站点烟火AI识别检测算法应用方案
    新能源汽车作为现代科技与环保理念的完美结合,其普及和应用本应带给人们更加便捷和绿色的出行体验。然而,近年来新能源汽车充电火灾事故的频发,无疑给这一领域投下了巨大的阴影。这不禁让人深思,为何这一先进的交通工具在充电过程中会引发火灾事故。从技术层面来看,新能源汽车的充电系......
  • TSINGSEE青犀AI智能分析网关V4的人员摔倒检测算法及应用
    人员摔倒检测AI算法是一种基于计算机视觉和机器学习的技术,它通过对视频或图像中的人员运动进行分析,自动检测并识别出摔倒事件。该算法采用了多种技术手段,包括深度学习、目标跟踪、姿态估计等,以实现高效、准确的摔倒检测。今天我们来介绍下TSINGSEE青犀AI智能分析网关V4的人员摔倒......
  • FreeRTOS教程10 低功耗
    1、准备材料正点原子stm32f407探索者开发板V2.4STM32CubeMX软件(Version6.10.0)KeilµVision5IDE(MDK-Arm)野火DAP仿真器XCOMV2.6串口助手2、学习目标本文主要学习FreeRTOS低功耗的相关知识,包括HAL库基础时钟、FreeRTOS基础时钟、低功耗处理和Tickless模式等知识3、......
  • aiohttp unix socket 启动简单说明
    aiohttp官方推荐了不少部署模式,以下是关于unixsocket部署的简单说明参考配置web.pyfromaiohttpimportwebimportargparseparser=argparse.ArgumentParser(description="aiohttpapp")parser.add_argument('--path')asyncdefhello(request):......
  • [Container] study goals for learning container
    LearningObjectivesBuildacontainerimageandstoreitinacontainerregistry.Describethefeatures,benefits,andusecasesofcontainers,andhowtheyaredifferentfromvirtualmachines.DefineDockerandlistsomeofthecommonlyusedDockerCLI......
  • 【ai技术】(3):树莓派4,成功安装ollama软件,内存4G,推荐使用命令行界面安装,使用raspi-config
    1,关于raspberrypi4项目https://www.bilibili.com/video/BV1K2421P71h/【ai技术】(3):树莓派4,成功安装ollama软件,内存4G,安装命令行版本,使用raspi-config配置wifi,速度9t/s2,下载raspberrypi镜像项目地址:https://www.raspberrypi.com/software/operating-systems/#r......
  • Ollama、Langchain相关学习资源(动态更新)
    大型预训练模型如GPT系列、BERT系列等,在消费级产品和垂直行业应用中加快了部署步伐,包括但不限于智能客服、内容创作、代码生成、决策支持等领域。随着大模型开源,相关的部署工具和框架也得到发展和完善。例如,出现了一些专门针对大模型本地部署的解决方案,像Ollama(虽然该名......
  • 用免费GPU部署自己的stable-diffusion项目(AI生成图片)
    2021年时出现了openAI的DALL,但是不开源。2022年一开年,DALL-E2发布,依然不开源。同年7月,Google公布其Text-to-Image模型Imagen,并且几乎在同一时间段AI图像生成平台Midjourney也进行公测。同年8月,StableDiffusion的发布将AIGC和AI绘画彻底带出了圈。StableDiffusion是......