首页 > 其他分享 >给Proxmox VE 虚拟机分配巨大分区惹麻烦

给Proxmox VE 虚拟机分配巨大分区惹麻烦

时间:2023-09-19 17:38:16浏览次数:32  
标签:VE 虚拟机 公有 NAS 集群 Proxmox


由于缺乏良好的规划,有开发人员直接在公有云采购一个容量超过100TB的NAS存储,使用过程中,数据的存储也没有规划,业务数据一股脑的写入到同一个目录,下边的子目录没有规律,用用户的图片、视频、访问日志、甚至还有备份。因应用日趋增多,公有云的使用成本急剧上升,考虑到成本及可控性,决定把公有云的NAS及所有应用迁移到自建的Proxmox VE超融合集群。


于是在Proxmox VE集群创建虚拟机,并给此虚拟机分配40T的磁盘空间,以单独的分区进行挂载。本来不愿意这样操作,建议使用者先清理掉无用的数据,对方答复,当前任务紧,文件目录又没规律,暂时无法进行操作,只能一锅端将公有云NAS上的数据复制到Proxmox VE上的虚拟机。托管机房及公有云对等开了300M的带宽,复制了将近一个月,才基本复制完。运行过程中,突遇Proxmox VE集群服务器全部同时重启,悲剧,Ceph OSD故障!用指令“ceph pg repair“,无效。因为集群上已经有业务在运行,如果重建ceph pool,再重新从公有云的NAS复制数据,完全不可能了。因为虚拟机分配的单分区太大,用各种方法,都不好使,最后只能等Ceph自己恢复。一共等了快一个月,才自动恢复成功。


为解决共享存储问题,购买了专门的设备,就是普通服务器插很多硬盘,SSD安装系统,NVME做缓存,部署TrueNAS,然后将Proxmox VE集群上的那个大分区的数据迁移,彻底排除集群的隐患。


这几天,开始释放这个巨大巨大无比的虚拟机,删除起来还很费时,差不多24小时,才进行到40%多。

给Proxmox VE 虚拟机分配巨大分区惹麻烦_磁盘镜像



我嫌这样释放太慢了,打算在Proxmox VE Web管理后台直接删掉VM磁盘,但不行的是,报错了,无法进行操作。

给Proxmox VE 虚拟机分配巨大分区惹麻烦_数据_02



登录集群任意节点宿主系统,命令行下执行“rbd ls -l hdd_pool”,看是否存在异常的虚拟机磁盘镜像。

给Proxmox VE 虚拟机分配巨大分区惹麻烦_数据_03



由输出可知,确实存在有问题的虚拟机磁盘镜像。用命令“rbd rm vm-100-disk-0 -p hdd_pool”进行清理。

给Proxmox VE 虚拟机分配巨大分区惹麻烦_公有云_04



同样的方法,将另一个异常的磁盘镜像“vm-127-disk-1”清理掉,再运行“rbd ls -l hdd_pool”,就可以看到虚拟机镜像磁盘的正常显示。

标签:VE,虚拟机,公有,NAS,集群,Proxmox
From: https://blog.51cto.com/sery/7526681

相关文章

  • 【gradle.kts maven 添加】【android】
    org.gradle.api.InvalidUserCodeException:Buildwasconfiguredtoprefersettingsrepositoriesoverprojectrepositoriesbutrepository'maven'wasaddedbybuildfile'app/build.gradle.kts'在setting里加  dependencyResolutionMa......
  • js removeRepeat 数组去重
    //数组不去重_this.incompleteData.map(e=>e.order_id).join(',')//数组去重varorder_ids=_this.incompleteData.map(e=>e.order_id).removeRepeat().join(','); ......
  • ORACLE--Connect By、Level、Start With的使用(Hierarchical query-层次查询)
    查找员工编号为7369的领导:1SELECTLEVEL,E.*FROMEMPECONNECTBYPRIORE.MGR=E.EMPNOSTARTWITHE.EMPNO=78762ORDERBYLEVELDESC"startwith"--thisidentifiesallLEVEL=1nodesinthetree"connectby"--describeshowtowalkfromt......
  • sql server单一某列实现排序
    WDBHAPPBHWDMC430175500443659sg430044033903992转发省环境保护厅省财政厅关于印发广东省排污权有偿使用和交易试点管理办法的通知(会签文)(修改).doc430175500443659430044033903992转发省环境保护厅省财政厅关于印发广东省排污权有偿使用和交易试点管理办法的通知(会签文).doc......
  • Spring Framework RCE CVE-2022-22965 漏洞分析
    摘要本文会从几个角度分析漏洞CVE-2022-22965,首先会从payload的构造。每次我都喜欢先分析漏洞的payload,不得不承认实力没达到可以直接分析漏洞地步。所以会先看看payload的构造过程看看,每次学习和分析漏洞的payload能学到很多有趣的角度和想法。从payload的构造分析,分析payload的......
  • Failed to determine a suitable driver class(maven不编译配置文件)
    现象:启动报错 问题排查与处理:1:根据错误翻译,是datasource没有一些配置属性。不过检查下来写法没有啥问题 2:注意启动端口是不是生效了。发现是配置文件没起作用 3:maven添加resources<resources><resource><directory>src/main/java</dir......
  • No active profile set, falling back to 1 default profile: "default"
    报错显示 解决办法 效果   ......
  • angular event服务,不同组件间参数传递
    利用AngularEvent在不同组件之间传递数据为了实现在Angular不同Component之间相互传递数据,可以使用Event分发的思路来实现。使用事件实现在不同组件之前传递数据的思路如下:定义一个服务,用来实现事件的发布和订阅方法。组件A注入事件服务的依赖,将自己要传递数据的数据以事件的形式......
  • tus-node-server 官方基于node 实现的tus server 1.0 发布
    tus-node-server是基于typescript开发的新的nodejsserver,通过拆分为独立的包(file,s3,gcs,server)包含的特性完全基于typescript开发拆分为了独立的包提供了新的events以及hooks升级了依赖包重新设计了存储file存储添加了过去扩展更好的周边集成(express,fastify。。。)......
  • [Design-Data-Intensive-Application] Scalability
    1scaleupbettercpubettersever2scaleout Weibo/post/user/follow1) postselectpostfrompostsjoinusersonp.send_id=u.idjoinfollowsonf.id=u.idwherecur_id=f.followee.id(read) celebrity->wirtepoststoeveryfollow......