首页 > 编程语言 >【Lustre相关】应用部署-01-源码编译IB驱动及lustre软件包

【Lustre相关】应用部署-01-源码编译IB驱动及lustre软件包

时间:2023-11-25 15:25:20浏览次数:34  
标签:01 x86 -- Lustre 源码 64 lustre rpm el7

一、编译安装

系统版本:CentOS Linux release 7.9.2009 (Core)
内核版本:3.10.0-1160.el7.x86_64
网卡型号:Mellanox Technologies MT2892 Family [ConnectX-6 Dx]
软件版本:lfs 2.12.9 ib

注:使用CentOS-7-x86_64-Everything-2009ISO,选择Minimal install安装,勾选Debugging ToolsDevelopment Tools软件包

1、安装e2fsprogs

下载地址:https://downloads.whamcloud.com/public/e2fsprogs/latest/el7/RPMS/x86_64/

下载安装e2fsprogs软件包

[root@node91 01-e2fsprogs]# ls
e2fsprogs-1.46.6-wc1.el7.x86_64.rpm            e2fsprogs-libs-1.46.6-wc1.el7.x86_64.rpm    libcom_err-devel-1.46.6-wc1.el7.x86_64.rpm
e2fsprogs-debuginfo-1.46.6-wc1.el7.x86_64.rpm  e2fsprogs-static-1.46.6-wc1.el7.x86_64.rpm  libss-1.46.6-wc1.el7.x86_64.rpm
e2fsprogs-devel-1.46.6-wc1.el7.x86_64.rpm      libcom_err-1.46.6-wc1.el7.x86_64.rpm        libss-devel-1.46.6-wc1.el7.x86_64.rpm
[root@node91 01-e2fsprogs]# yum install *.rpm

2、安装lustre内核版本

下载地址:https://downloads.whamcloud.com/public/lustre/lustre-2.12.9-ib/el7.9.2009/server/RPMS/x86_64/

安装lustre内核版本,重启后查看当前内核版本信息为3.10.0-1160.49.1.el7_lustre.x86_64

[root@node91 02-kernel-lustre]# ls
kernel-3.10.0-1160.49.1.el7_lustre.x86_64.rpm            kernel-debuginfo-common-x86_64-3.10.0-1160.49.1.el7_lustre.x86_64.rpm  kernel-headers-3.10.0-1160.49.1.el7_lustre.x86_64.rpm
kernel-debuginfo-3.10.0-1160.49.1.el7_lustre.x86_64.rpm  kernel-devel-3.10.0-1160.49.1.el7_lustre.x86_64.rpm
[root@node91 02-kernel-lustre]# yum install *.rpm
[root@node91 02-kernel-lustre]# reboot

3、编译安装IB驱动包

下载地址:https://network.nvidia.com/products/infiniband-drivers/linux/mlnx_ofed/#tabs-1
相关版本选择如下:
Archive Version
-Version(Archive):5.8-1.1.2.1-LTS
-OS Distribution:RHEL/CentOS/Rocky
-OS Distribution Version:RHEL/CentOS 7.9
-Architecture:x86_64
-Download:MLNX_OFED_LINUX-5.8-1.1.2.1-rhel7.9-x86_64.tgz

  • 安装依赖包:
yum install libusbx pciutils lsof tcl fuse-libs tcsh tk python-devel createrepo
  • IB驱动编译安装
tar -zxvf MLNX_OFED_LINUX-5.8-1.1.2.1-rhel7.9-x86_64.tgz
cd MLNX_OFED_LINUX-5.8-1.1.2.1-rhel7.9-x86_64
 ./mlnxofedinstall --all --force --without-kmod-iser --without-xpmem-modules --without-libxpmem --add-kernel-support
dracut -f
/etc/init.d/openibd restart
  • 检查openibdopensmd服务状态
[root@node91 MLNX_OFED_LINUX-5.8-1.1.2.1-rhel7.9-x86_64]# /etc/init.d/openibd status


  HCA driver loaded


Configured IPoIB devices:
ib0 ib1


Currently active IPoIB devices:
ib0
ib1
Configured Mellanox EN devices:


Currently active Mellanox devices:
ib0
ib1


The following OFED modules are loaded:


  rdma_ucm
  rdma_cm
  ib_ipoib
  mlx5_core
  mlx5_ib
  ib_uverbs
  ib_umad
  ib_cm
  ib_core
  mlxfw

4、编译安装lustre

下载地址:https://downloads.whamcloud.com/public/lustre/lustre-2.12.9-ib/el7.9.2009/server/SRPMS/

  • 安装依赖包
yum -y install automake xmlto asciidoc elfutils-libelf-devel zlib-devel binutils-devel newt-devel python-devel libyaml-devel
yum -y install pesign numactl-devel pciutils-devel ncurses-devel libselinux-devel
yum -y install attr cifs-utils gssproxy keyutils libbasicobjects libcollection libevent libini_config libldb libnfsidmap libpath_utils libref_array libtalloc libtdb libtevent libtirpc  libverto-libevent libwbclient net-tools  nfs-utils psmisc quota quota-nls resource-agents rpcbind samba-client-libs samba-common samba-common-libs tcp_wrappers
  • 下载源码文件,编译软件包
wget https://downloads.whamcloud.com/public/lustre/lustre-2.12.9-ib/el7.9.2009/server/SRPMS/lustre-2.12.9-1.src.rpm
rpm2cpio lustre-2.12.9-1.src.rpm |cpio -div
tar -zxvf lustre-2.12.9.tar.gz
cd lustre-2.12.9
time ./configure --with-o2ib=/usr/src/ofa_kernel/default 2>&1 | tee log-configure.txt
time make -j $(nproc) rpms  2>&1 | tee log-make.txt
  • 解决dysm错误,编译安装mlnx kmod软件

Re: [lustre-discuss] ksym errors on kmod-lustre RPM after 2.12.0 build against MOFED 4.5-1

rpmbuild --rebuild --define 'KMP 1' mlnx-ofa_kernel-5.8-OFED.5.8.1.1.2.1.src.rpm
rpm -ivh /root/rpmbuild/RPMS/x86_64/kmod-mlnx-ofa_kernel-5.8-OFED.5.8.1.1.2.1.x86_64.rpm
  • 安装lustre编译软件包
[root@node91 04-lustre]# ls *.rpm
kmod-lustre-2.12.9-1.el7.x86_64.rpm              lustre-2.12.9-1.el7.x86_64.rpm            lustre-osd-ldiskfs-mount-2.12.9-1.el7.x86_64.rpm
kmod-lustre-osd-ldiskfs-2.12.9-1.el7.x86_64.rpm  lustre-debuginfo-2.12.9-1.el7.x86_64.rpm  lustre-resource-agents-2.12.9-1.el7.x86_64.rpm
kmod-lustre-tests-2.12.9-1.el7.x86_64.rpm        lustre-iokit-2.12.9-1.el7.x86_64.rpm      lustre-tests-2.12.9-1.el7.x86_64.rpm
[root@node91 04-lustre]# yum install *.rpm

二、软件部署

1、IB网络配置

  • 查看当前存在两个ib网卡
[root@node91 ~]# ibstatus 
Infiniband device 'mlx5_0' port 1 status:
    default gid:     fe80:0000:0000:0000:e8eb:d303:0032:056e
    base lid:     0xa4
    sm lid:         0x33
    state:         4: ACTIVE
    phys state:     5: LinkUp
    rate:         200 Gb/sec (4X HDR)
    link_layer:     InfiniBand


Infiniband device 'mlx5_1' port 1 status:
    default gid:     fe80:0000:0000:0000:e8eb:d303:0032:2d6a
    base lid:     0xa5
    sm lid:         0x33
    state:         4: ACTIVE
    phys state:     5: LinkUp
    rate:         200 Gb/sec (4X HDR)
    link_layer:     InfiniBand
  • 修改ib0网卡配置,重启网络服务
[root@node91 ~]# cat /etc/sysconfig/network-scripts/ifcfg-ib0 
CONNECTED_MODE=no
TYPE=InfiniBand
PROXY_METHOD=none
BROWSER_ONLY=no
BOOTPROTO=static
DEFROUTE=yes
IPV4_FAILURE_FATAL=no
IPV6INIT=yes
IPV6_AUTOCONF=yes
IPV6_DEFROUTE=yes
IPV6_FAILURE_FATAL=no
IPV6_ADDR_GEN_MODE=stable-privacy
NAME=ib0
UUID=32420cf2-6708-4cc7-b2b6-c27b55e3480b
DEVICE=ib0
ONBOOT=yes
IPADDR=30.6.1.147
PREFIX=16
[root@node91 ~]# systemctl restart network

2、配置lustre集群

  • 修改lustre相关配置,加载相关模块
modinfo lustre
echo "options lnet networks=o2ib(ib0)" > /etc/modprobe.d/lustre.conf
depmod -a
systemctl restart lustre
  • 关闭防火墙
systemctl disable firewalld
systemctl stop firewalld
  • 创建mdt、mgt、ost,挂载lustre集群
mkdir /lustre/mdt0 -p
mkdir /lustre/ost0 -p
mkfs.lustre --mgs --mdt --index 0 --backfstype=ldiskfs /dev/sdb 
mkfs.lustre --fsname lustre --mgs --mdt --index 0 --backfstype=ldiskfs /dev/sdb
mount -t lustre /dev/sdb /lustre/mdt0/
mkfs.lustre --fsname=lustre --ost --mgsnode=30.6.1.147@o2ib --index 0 --backfstype=ldiskfs /dev/sdc
mount /dev/sdc /lustre/ost0/
mount -t lustre /dev/sdc /lustre/ost0/

mkdir /lustrefs
mount -t lustre 30.6.1.147@o2ib:/lustre /lustrefs/

标签:01,x86,--,Lustre,源码,64,lustre,rpm,el7
From: https://www.cnblogs.com/luxf0/p/17855550.html

相关文章

  • Sumsets(UVA10125)整数集合
    备课的时候发现了这道题,对于初识哈希来说并不算一道很简单的题。在查阅林厚从老师的示例代码与往届OI选手的博客后,大致理解了本题的思路。相关标签:Hash跳转至本题Description给定一个整数集合S,求一个最大的d,满足a+b+c=d,其中a,b,c,d∈SInput多组数据,每组数据包括:第一行一......
  • spring boot工业互联网高精度位置信息服务平台源码
    UWB定位系统源码,UWB人员定位系统全套源码行业背景工业企业多存在很多有毒有害、高危高压等生产环境,带电设备众多,容易发生安全事故;人员只能凭记忆遵守各项生产安全规范,如某些危险区域范围、带电体的安全距离、各项作业的规范;一旦疏忽后果严重,安全作业无后盾;生产安全的重点区域,无全方......
  • muduo源码剖析之前序
    目录生疏阻塞、非阻塞同步、异步Linux上的五种IO模型Reactor模式muduo的基本使用生疏在进行日志库的开发时,涉及到的几个重要的宏:__FILE__:文件名称,包含路径__LINE__:行号__func__:函数名称cpp中含有默认参数时,函数声明和定义不能同时出现cpp中静态成员变量以及静态成员函......
  • 开源小说站源码php+付费阅读小说网站系统源码附全自动采集和搭建教程
    随着互联网的普及,网络小说已成为现代人生活不可或缺的一部分。与此同时,越来越多的人开始关注小说网站源码的开发,希望通过开发自己的小说网站来满足读者的需求。本文将从小说网站源码的设计、开发、运维等方面进行探讨,以帮助读者更好地了解小说网站源码的相关知识。源码:xsymz.icu......
  • Java二级医院区域HIS信息管理系统源码(SaaS服务)
    一个好的HIS系统,要具有开放性,便于扩展升级,增加新的功能模块,支撑好医院的业务的拓展,而且可以反过来给医院赋能,最终向更多的患者提供更好的服务。系统采用前后端分离架构,前端由Angular、JavaScript开发;后端使用Java语言开发。融合B/S版电子病历系统,支持电子病历四级。系统运行稳定、......
  • 重庆建峰工业集团弛源化工分公司选购我司HS-TGA-101热重分析仪
    近日,重庆建峰工业集团有限公司弛源化工分公司已成功选购我司HS-TGA-101热重分析仪。此次采购是对我司产品性能和质量的极高认可,也是对我们在热分析领域专业能力的肯定。重庆建峰工业集团有限公司弛源化工分公司重庆建峰工业集团有限公司弛源化工分公司是一家在化工领域有着深厚积累......
  • 基于django的4s店客户管理系统-计算机毕业设计源码+LW文档
    摘 要 进入21世纪网络和计算机得到了飞速发展,并和生活进行了紧密的结合。目前,网络的运行速度以达到了千兆,覆盖范围更是深入到生活中的角角落落。这就促使管理系统的发展。网上办公可以实现远程处理事务,远程提交工作和随时追踪工作的状态。网上管理系统给人们带来前所未有的体......
  • 001反转一个3位整数
    1.问题描述反转一个只有3位数的整数。2.示例输入num=123,输出321,输入num=100,输出1. 3.代码示例3.1python1classSolution:2defreverseInt(self,num):3ifisinstance(num,int)andnum<999andnum>99:4hundreds=int(num/1......
  • [Deeplearning] 2017篮球队
    一道动态规划题\(f_{i, j, k}\)表示前i个人里取j个,身高大于等于k的方法数得到状态转移方程为\(f_{i, j, k} = f_{i − 1, j − 1, k − a_i}\)由于这样空间不够,我们需要降维代码:#include<bits/stdc++.h>usingnamespacestd;constintMAXN=2e5+5;intn,m,h......
  • 基于python的计算机网络在线考试系统-计算机毕业设计源码+LW文档
    摘 要现代经济快节奏发展以及不断完善升级的信息化技术,让传统数据信息的管理升级为软件存储,归纳,集中处理数据信息的管理方式。本基于python的计算机网络在线考试系统就是在这样的大环境下诞生,其可以帮助管理者在短时间内处理完毕庞大的数据信息,使用这种软件工具可以帮助管理人员......