背景
随着 Nodejs 的兴起,越来越多的 Web 服务中间层被搭建起来。如 Node 服务端渲染,BFF(Backend For Frontend))层,而 RPC 是远端过程调用,经常用于 BFF 层。最近,我打算写一个中间层,用 Nodejs 调用 Go 服务,除了可以简单用 http 调用之外,发现还有基于 RPC 的调用就研究了一下。
RPC简介
RPC(Remote Procedure Call)中文名「远程过程调用」,拆开理解,「过程」也叫方法或函数,「远程」就是说方法不在当前进程里,而是在其他进程或机器上面,合起来 RPC 就是调用其他进程或机器上面的函数。简单讲,就是本地调用的逻辑处理的过程放在的远程的机器上,而不是本地服务代理来处理。一个完整的 RPC 框架主要有三部分组成:通信框架、通信协议、序列化和反序列化格式。
前端视角看RPC
与 Ajax 对比相同点
都是两个计算机之间的网络通信,Ajax 是浏览器和服务器通信,RPC 是服务器和服务器通信
都需要双方约定一个数据格式
与 Ajax 对比不相同点
RPC 调用不一定使用 DNS 作为寻址服务,Ajax 一般是浏览器向服务器请求,请求地址一般是https://域名/xxx,服务器需要根据域名区寻找对应的 IP 地址,这就是 DNS 寻址过程,而 RPC 一般用在内网之间互相请求,一般使用特有服务进行寻址。
RPC 应用层协议一般不使用 HTTP,一般使用一些二进制协议,其优点是数据包体积更小、编解码速率更快。
RPC 基于 TCP 或 UDP 协议,其中 TCP 通信又存在多种通信方式,单工通信[两个服务器之间,只允许单向发送消息,如只能 A 给 B 发消息]、半双工通信[两个服务器之间,同一时间只允许单向发送消息,如时间段一 A 发给 B,时间段二 B 发给 A,又称为轮番单工通信]、全双工通信[可以自由互相发送消息]。
RPC与HTTP区别
RPC 通常所讲是一个框架,而 HTTP(HyperText Transfer Protocol) 是基于 TCP 的实现的超文本传输协议,HTTP 是无状态协议;最初用于浏览器与服务器的通信,后来广泛用于各个服务间的通信。
RPC 是远程过程调用,RPC 框架可以的通信过程可以使用各种通信协议(如 HTTP,TCP 以及各种自定义协议)实现。良好的 rpc 调用是面向服务的封装,针对服务的可用性和效率等都做了优化。单纯使用 http 调用则缺少了这些特性。
RPC基本原理
首先来看看一个 基于 TCP 的 RPC 调用的基本流程,以便对它有个宏观的认识。
调用方(Client)通过本地的 RPC 代理(Proxy)调用相应的接口
本地代理将 RPC 的服务名,方法名和参数等等信息转换成一个标准的 RPC Request 对象,即组装成能够进行网络传输的消息体
RPC 框架采用 RPC 协议(RPC Protocol)将 RPC Request 对象序列化成二进制形式,然后通过 TCP 通道传递给服务提供方 (Server)
服务端(Server)收到二进制数据后,将它反序列化成 RPC Request 对象(解码)
服务端(Server)根据 RPC Request 中的解码信息找到本地对应的方法,传入参数执行,得到结果,并将结果封装成 RPC Response 交给 RPC 框架
RPC 框架将 RPC Response 对象序列化成二进制形式,然后通过 TCP 通道传递给服务调用方(Client)
调用方(Client)收到二进制数据后,将它反序列化成 RPC Response 对象,并且将结果通过本地代理(Proxy)返回给业务代码
调用方(Client)得到最终结果。
RPC 的目标就是要将 2~8 这些步骤都封装起来,让用户对这些细节透明。
简单RPC通信协议设计
通常它由一个 Header 和一个 Payload(类似于 HTTP 的 Body)组成,合起来叫一个包(Packet)。之所以要有包,是因为二进制只完成 Stream 的传输,并不知道一次数据请求和响应的起始和结束,我们需要预先定义好包结构才能做解析。
协议设计就像把一个数据包按顺序切分成若干个单位长度的「小格子」,然后约定每个「小格子」里存储什么样的信息,一个「小格子」就是一个 Byte,它是协议设计的最小单位,1 Byte 是 8 Bit,可以描述 0 ~ 2^8 个字节数,具体使用多少个字节要看实际存储的信息。
简单包结构设计
标记包的类型,比如:0 表示请求,1 表示响应,需要一个Byte
关联ID,将请求和它对应的响应关联起来,这个 ID 我们选择用一个 Int32 类型(4 Bytes)自增的数字表示
Payload 长度记录,要能实现包的准确切割,我们需要明确包的长度,用4个Byte
应用层协议类型标记,一个Byte
0 1 2 3 4 5 6 7 8 9 10+------+------+------+------+------+------+------+------+------+------+| type | requestId | codec| bodyLength |+------+---------------------------+------+---------------------------+| ... payload || ... |+---------------------------------------------------------------------+
这已经是可以工作的 RPC 通讯协议了,但随着 RPC 功能的增加我们可能需要记录更多的信息,这里就不说了。可以自行再了解。
Nodejs实现RPC通信协议
Nodejs 中有个 Buffer 模块,可以提供对二进制数据的操作。所以我们可以用来进行二进制的编码和解码,结合上面的通信协议,可以写出编码和解码部分代码。
简单编码部分
// 编码const payload = {service: 'com.test',methodName: 'plus',args: [ 1, 2 ],};const body = new Buffer(JSON.stringify(payload));const header = new Buffer(10);header[0] = 0;header.writeInt32BE(1000, 1);header[5] = 1; // codec => 1 代表是 JSON 序列化header.writeInt32BE(body.length, 6);const packet = Buffer.concat([ header, body ], 10 + body.length);
简单解码部分
// 解码const type = buf[0]; // => 0 (request)const requestId = buf.readInt32BE(1); // => 1000const codec = buf[5];const bodyLength = buf.readInt32BE(6);const body = buf.slice(10, 10 + bodyLength);const payload = JSON.parse(body);
Nodejs流行的RPC框架
grpc —— https://grpc.io, 这个是国外比较流行的,有 google 背书,支持多语言,听说使用的公司也比较多,看上去是比较成熟的框架。
sofa —— https://tech.antfin.com/sofa 这个是国内阿里开源的,目前阿里开源的 Eggjs 框架也开源了基于 sofa 的最佳实践。
DUBBO —— 阿里开源的 java RPC 框架
参考资料
《Node.js 开发实战》
https://cnodejs.org/topic/5cf349f91fe902120f31b47a
https://www.yuque.com/egg/nodejs/dklip5#dl4qug