一、概要
Nacos
是阿里开放的一款中间件,它主要提供三种功能:持久化节点注册,非持久化节点注册和配置管理。
二、一致性协议 - AP/CP
Nacos
不是纯粹的AP
服务,也不是纯粹的CP
服务,而是两者同时支持。
这要从服务注册说起,Provider
启动时将自身的信息注册至注册中心,如果注册中心是Zookeeper
,在注册时可以选择注册临时节点或者永久节点。如果注册中心是Eureka
,服务注册只能注册临时节点。
Nacos
同时借鉴了两者的模式,如果在Nacos
上注册临时节点,那么Nacos
就是AP
服务,保证高可用。如果Nacos
上注册永久节点,那么Nacos
就是CP
服务,保证数据一致性。
Nacos
对这两者区分实现,通过Distro
协议来实现AP
,通过Raft
来实现CP
。
2.1 Distro-AP
Distro
协议的主要设计思想如下:
Nacos
每个节点都可以处理写请求,同时把数据同步到其他节点- 每个节点只负责部分数据,定时发送自己负责数据的校验值到其他节点来保持数据一致性
- 每个节点独立处理写请求,及时从本地发出响应
其实和Eureka
差不多,多了每个节点独立负责一部分数据这个特性
数据初始化
当新节点加入时,它会轮询所有的Distro
节点,只要一个节点正常响应就会拉取全量数据。
数据校验
在Distro
集群启动后,各台机器之间会定期发送心跳,心跳信息主要为各个机器上的所有数据的元信息,这种数据校验会以心跳的形式进行,即每台机器在固定的时间间隔会向其他机器发起一次数据校验请求,一旦在数据校验过程中,某台机器发现其他机器上的数据与本地数据不一致,则会发起一次全量拉取请求,将数据补齐。
写操作
当客户端写入注册非持久节点的请求时,Distro集群处理的流程图如下:
Distro
会计算当前数据所属的节点,如果当前节点不是处理该数据的节点,那Distro
会将其转发至责任节点,再由责任节点对其做请求解析,然后跟随定时Sync
任务,将数据同步到其他Distro
节点上。
2.2 Raft-CP
Nacos
通过Raft
来实现CP
,详细可以看这:分布式一致性算法Raft
不过Nacos
已经准备用JRaft
来替换Raft
了,相关的特性正在开发中,JRaft
的详细可以看这里:JRaft RheaKV 用户指南
三、心跳检测
Nacos
的心跳检测比较有特色。常规的心跳检测方式有两种,一种是客户端主动上报,服务端一段时间未收到心跳就会将客户端下线。另一种是服务端主动去调客户端的心跳接口,如果没有得到正常响应或者超时就将客户端下线。
在注册中心的场景中,客户端的数量一定是会远多于服务端的,如果让服务端去主动轮询心跳接口,会给服务端比较大的压力,所以目前的主流选择都是让客户端去主动上报。
但是Nacos
对临时节点和永久节点分别做了处理,如果是临时节点,那么就需要临时节点主动上报,如果是永久节点,Nacos
可以主动发起TCP
端口检查或者是HTTP
接口检查,用来做健康检查。
在Nacos
的定义中,临时节点都是弹性扩容之后注册的,随着访问量下来,相关服务是会被回收的,而有的永久节点是无法发起健康检查的,例如一些三方服务,只能提供出一个接口用于心跳检查。
四、配置中心原理
客户端启动后,每30秒给Server发送一个心跳包,Server拿到心跳包之后,先对比一下数据版本,如果版本一样说明数据没有变化,这时Server不会立即将该心跳返回,Server会一直拿着这个心跳,此时和客户端保持长连接的状态,直到数据有变化或者持有超过29.5秒,如果客户端感知到数据版本发生变化,就会主动请求Server拉取数据。
阿里出品的中间件都有个特点,不像一个纯粹的中间件,更像是业务锤炼出来的产物,在RocketMQ
,Nacos
上这种味道特别明显,它总是会考虑非常多的业务场景,在性能与好用性方面做一个取舍,使用阿里中间件的最大感受就是:它也许不是性能最好的,也许不是纯粹的,但是一定是最适合拿来做业务的。