首页 > 其他分享 >对象存储服务-Minio

对象存储服务-Minio

时间:2023-06-11 19:02:04浏览次数:57  
标签:存储 Minio 对象 minio data MINIO

Mino


目录



  • Mino
  • 对象存储服务
  • Minio
  • 参考
  • Minio 架构
  • 为什么要用 Minio
  • 存储机制
  • 纠删码
  • MinIO概念
  • 部署
  • 单机部署:
  • Docker 部署Minio
  • 分布式Minio
  • Minio配置
  • 如何存储和访问对象
  • MinIO Client (mc)
  • 命令使用
  • 通过代码存储对象


对象存储服务(Object Storage Service,OSS)是一种海量、安全、低成本、高可靠的云存储服务,适合存放任意类型的文件。容量和处理能力弹性扩展,多种存储类型供选择,全面优化存储成本。

对象存储服务

在项目开发过程中,我们会产生大量的对象数据,包括:日志文件,数据库脚本文件、安装包,容器镜像,图像、视频等等,我们不仅仅是需要有一个集中的地方来存储,还需要能基于 Web 的方式来访问它们,以往我们有以下几种方法来解决:

  • 阿里云、Azure 等云服务商提供的SaaS 级别的 OSS 服务
  • 自己搭建 NAS 网络存储通过 Samba 服务来访问
  • 自己搭建 FTP 服务器来存储

对象存储服务-Minio_服务器

本篇文章主要介绍下其中的Minio方案

Minio

对象存储服务-Minio_对象存储_02


Minio是GlusterFS创始人之一Anand Babu Periasamy发布新的开源项目。Minio兼容Amason的S3分布式对象存储项目,采用Golang实现,客户端支持Java,Python,Javacript, Golang语言。

Minio是建立在云原生的基础上;有分布式和共享存储等功能;旨在多租户环境中以可持续的方式进行扩展的对象存储服务。它最适合存储非结构化数据,如:照片、视频、日志文件、容器/虚拟机/映像等,单次存储对象的大小最大可达5TB

参考

  • https://min.io/
  • http://www.minio.org.cn/
  • minio/minio-service: Collection of MinIO server scripts for upstart, systemd, sysvinit, launchd. (github.com)

Minio 架构

对象存储服务-Minio_数据_03

左边是 MINIO 集群的示意图,整个集群是由多个角色完全相同的节点所组成的。因为没有特殊的节点,所以任何节点宕机都不会影响整个集群节点之间的通信。通过 rest 跟 RPC 去通信的,主要是实现分布式的锁跟文件的一些操作

右边这张图是单个节点的示意图,每个节点都单独对外提供兼容 S3 的服务

为什么要用 Minio

  • 1、Minio 有良好的存储机制
  • 2、Minio 有很好纠删码的算法与擦除编码算法
  • 3、拥有RS code 编码数据恢复原理
  • 4、公司做强做大时,数据的拥有重要性,对数据治理与大数据分析做准备。
  • 5、搭建自己的一套文件系统服务,对文件数据进行安全保护。
  • 6、拥有自己的平台,不限于其他方限制。

存储机制

  • Minio使用纠删码erasure code和校验和checksum来保护数据免受硬件故障和无声数据损坏。 即便丢失一半数量(N/2)的硬盘,仍然可以恢复数据。

纠删码

  • 纠删码是一种恢复丢失和损坏数据的数学算法,目前,纠删码技术在分布式存储系统中的应用主要有三类,阵列纠删码(Array Code: RAID5、RAID6 等)、RS(Reed-Solomon)里德-所罗门类纠删码和 LDPC(LowDensity Parity Check Code)低密度奇偶校验纠删码。Erasure Code 是一种编码技术,它可以将 n 份原始数据,增加 m 份数据,并能通过 n+m 份中的任意 n 份数据,还原为原始数据。即如果有任意小于等于 m 份的数据失效,仍然能通过剩下的数据还原出来

MinIO概念

如下图,每一行是一个机器节点,这里有32个集群,每个节点里有一个小方块,我们称之为Drive,Drive可简单地理解为磁盘。一个节点有32个Drive,相当于32个磁盘。

Set是一组Drive的集合,所有红色标识的Drive组成了一个Set。

对象存储服务-Minio_数据_04


一个对象存储在一个Set上; 一个集群划分为多个Set

一个Set包含的Drive数量是固定的, 默认由系统根据集群规模自动计算得出 MINIO_ERASURE_SET_DRIVE_COUNT

一个SET中的Drive尽可能分布在不同的节点上

部署

Minio 提供了两种部署方式:单机部署和分布式,两种部署方式都非常简单,其中分布式部署还提供了纠删码功能来降低数据丢失的风险

单机部署:

wget https://dl.min.io/server/minio/release/linux-amd64/minio chmod +x minio ./minio server /data``  #``若``/data``目录不存在,要新建一个

Docker 部署Minio

mkdir /data/minio-data&&mkdir /data/minio-config # 创建一个数据存储目录
docker run -p 9000:9000 --name minio \
-d --restart=always \
-e "MINIO_ACCESS_KEY=admin" \
-e "MINIO_SECRET_KEY=admin123456" \
-v /data/minio-data:/data \
-v /data/minio-config:/root/.minio \
minio/minio server /data

http://localhost:9000/ 即可登陆Minio 的管理界面

对象存储服务-Minio_对象存储_05

分布式Minio

对象存储服务-Minio_对象存储_06


单机Minio服务存在单点故障,相反,如果是一个有 m 台服务器, n 块硬盘的分布式Minio,只要有 m/2 台服务器或者 m*n/2 及更多硬盘在线,你的数据就是安全的。

例如,一个16节点的Minio集群,每个节点200块硬盘,就算8台服務器宕机,即大概有1600块硬盘,这个集群仍然是可读的,不过你需要9台服務器在线才能写数据。

export MINIO_ACCESS_KEY=<ACCESS_KEY>export MINIO_SECRET_KEY=<SECRET_KEY>minio server http://host{1...n}/export{1...m} http://host{1...o}/export{1...m}

当然如果我们只有一台机器,但是想用纠删码的功能,也可以直接配置使用多个本地盘
minio server /data1 /data2 /data3 ... /data8

Minio配置

默认的配置目录是 ${HOME}/.minio,你可以使用--config-dir命令行选项重写之。MinIO server在首次启动时会生成一个新的config.json,里面带有自动生成的访问凭据。
minio server --config-dir /etc/minio /data

  • 证书目录

TLS证书存在${HOME}/.minio/certs目录下,你需要将证书放在该目录下来启用HTTPS

  • 凭据

只能通过环境变量MINIO_ROOT_USER 和 MINIO_ROOT_PASSWORD 更改MinIO的admin凭据和root凭据。使用这两个值的组合,MinIO加密存储在后端的配置

export MINIO_ROOT_USER=minioexport MINIO_ROOT_PASSWORD=minio13minio server /data

如何存储和访问对象

将对象数据存储到 Minio 中有以下几种方式:
• 通过 MINIO CLIENT
• 通过 MINIO SDK 目前支持的语言包括:Go,Java,Node.js,Python,.NET
• 通过浏览器访问 Web 管理界面,在管理界面中上传和下载对象
• 如果你有存储目录 minio-data 的账号和访问权限,可以直接使用 SCP 命令将数据写入磁盘

MinIO Client (mc)

wget https://dl.min.io/client/mc/release/linux-amd64/mc
chmod +x mc

MinIO Client (mc)为ls,cat,cp,mirror,diff,find等UNIX命令提供了一种替代方案。它支持文件系统和兼容Amazon S3的云存储服务(AWS Signature v2和v4)。

命令使用
ls       列出文件和文件夹。
mb       创建一个存储桶或一个文件夹。
cat      显示文件和对象内容。
pipe     将一个STDIN重定向到一个对象或者文件或者STDOUT。
share    生成用于共享的URL。
cp       拷贝文件和对象。
mirror   给存储桶和文件夹做镜像。
find     基于参数查找文件。
diff     对两个文件夹或者存储桶比较差异。
rm       删除文件和对象。
events   管理对象通知。
watch    监听文件和对象的事件。
policy   管理访问策略。
session  为cp命令管理保存的会话。
config   管理mc配置文件。
update   检查软件更新。
version  输出版本信息。

列出Mino服务端

对象存储服务-Minio_数据_07

命令行创建bucket

对象存储服务-Minio_服务器_08

对象存储服务-Minio_数据_09

通过代码存储对象

// 构造访问对象
var minio = new MinioClient("localhost:9000","accessKey","secretKey");
// 输出所有的 Buckets 
var rs = minio.ListBucketsAsync();
foreach (varbucket in rs.Result.Buckets)
{
    Console.Out.WriteLine(bucket.Name + " " + bucket.CreationDateDateTime);
}
// 存储对象
var bucketName = "logs";
var objectName = "logs.zip";
var filePath = "c:\\logs.zip";
var contentType = "application/zip";
minio.PutObjectAsync(bucketName, objectName, filePath, contentType);
// 获取对象
var find  = minio.GetObjectAsync(bucketName, objectName)


对象存储服务-Minio_对象存储_10

标签:存储,Minio,对象,minio,data,MINIO
From: https://blog.51cto.com/devopsingroad/6458598

相关文章

  • 实验7 面向对象编程与内置模块
    实验1task1.py实验源码:classAccount:'''一个模拟银行账户的简单类'''def__init__(self,name,account_number,initial_amount=10):'''构造新账户'''self._name=nameself._card_no=......
  • 面向对象的设计原则
    什么样的代码可以称之为好代码?又如何评价代码比较差?每个人也许都有自己的标准,但是在软件设计领域中,有一套通过经验总结出来的,可以有效解决问题的指导思想和方法论,遵从这些原则,可以事半功倍,反之则有可能带来一些麻烦。SOLIDSOLID是五种设计原则首字母的缩写,有趣的是这个单词本身......
  • 实验七 面向对象编程与内置模块
    实验一classAccount:#一个模拟银行账户的简单类def__init__(self,name,account_number,initial_amount=10):self._name=nameself._card_no=account_numberself._balance=initial_amountdefdeposit(self,amount):......
  • 14.队列的顺序存储
    1.队列的概念1.1队列的定义队列(queue)是只允许在一端进行插入操作,而在另一端进行删除操作的线性表。队列是一种先进先出(FirstInFirstOut)的线性表,简称FIFO。允许插入的一端称为队尾,允许删除的一端称为队头。队头(Front):允许删除的一端,又称队首。队尾(Rear):允许插入的一端。空......
  • java——微服务——spring cloud——Nacos——Nacos服务分级存储模型——集群配置
                  ......
  • 针对SpringBoot服务端返回的空对象和空数组问题
    返回的Json会自动过滤掉空指针的对象,但是若遇到非空指针的没有任何内容的对象,举例如下:publicclassPerson{privateStringname;privateIntegerage;privateBooleansex;publicStringgetName(){returnname;}publicvoidsetNam......
  • Cassandra 的数据存储结构——本质是SortedMap<RowKey, SortedMap<ColumnKey, ColumnV
    Cassandra的数据存储结构Cassandra的数据模型是基于列族(ColumnFamily)的四维或五维模型。它借鉴了Amazon的Dynamo和Google'sBigTable的数据结构和功能特点,采用Memtable和SSTable的方式进行存储。在Cassandra写入数据之前,需要先记录日志(CommitLog),然后数据开始写......
  • NoSQL生态系统——类似Bigtable列存储,或者Dynamo的key存储(kv存储如BDB,结构化存储如red
    摘自:http://www.ituring.com.cn/article/4002#NoSQL系统的数据操作接口应该是非SQL类型的。但在NoSQL社区,NoSQL被赋予了更具有包容性的含义,其意为NotOnlySQL,即NoSQL提供了一种与传统关系型数据库不太一样的存储模式,这为开发者提供了在关系型数据库之外的另一种选择。在关联型的数......
  • 通过ftp & sftp 进行minio 管理
    minio4.20发布的版本支持基于ftp以及sftp进行minio管理了,对于一些业务需要使用ftp以及sftp的就比较方便了我们同时可以使用多协议模式进行minio访问了参考使用docker-compose version:'3'services:app:image:minio/minio:RELEASE.2023-06-02T23-17-26Z.fipscommand:......
  • 详解Python线程对象daemon属性对线程退出的影响
    进程、线程的概念以及多线程编程的基础知识请参考文末给出的方式在公众号历史文章中查找相关文章进行阅读。本文重点介绍线程对象daemon属性在线程退出时产生的作用和影响。首先,我们来看一下官方文档对守护线程(daemonthread)的描述:再来看一下官方文档对线程对象daemon属性的描述:可......