首页 > 其他分享 >我试图通过这篇文章告诉你,什么是神奇的泛化调用。

我试图通过这篇文章告诉你,什么是神奇的泛化调用。

时间:2023-11-27 13:11:38浏览次数:33  
标签:Dubbo 调用 泛化 接口 API 篇文章 方法

你好呀,我是歪歪。

关于 RPC 调用,大家肯定都是比较熟悉的了,就是在微服务架构下解决系统间通信问题的一个玩意。

其中的典型代表之一就是 Dubbo 了:

在微服务架构下,我们针对某个 RPC 接口,我们一般有两个角色。

  • 服务消费者 (Dubbo Consumer),发起业务调用或 RPC 通信的 Dubbo 进程
  • 服务提供者 (Dubbo Provider),接收业务调用或 RPC 通信的 Dubbo 进程

假设我是服务消费者,想要调用某个服务,只要我们链接到的是同一个服务注册中心,那么找对应服务要到 API 包对应的 Maven 坐标,引入到项目中,就类似于这样的东西:

<dependency>
    <groupId>org.apache.dubbo</groupId>
    <artifactId>dubbo-spring-boot-demo-interface</artifactId>
    <version>${project.parent.version}</version>
</dependency>

那么对于这个 API 包中的接口,虽然我们没有具体的实现类,但是我们还是能像调用本地方法一样调用该服务提供的接口。

这些都是常规的东西了,你肯定是门清。

那我现在问你一个问题啊:

我是服务消费者,我要调用一个服务提供者的 RPC 接口,但是我又不想引入它的 API 包,或者我根本就拉取不到它的 API 包,那么我应该怎么办?

如果你要非给我说:这不可能,既然是要消费别人的接口,那么肯定要拿到 API 包才对,你不拿就是你偷懒。

那我再给你举个歪师傅在实际开发过程中遇到的具体的例子:网关服务。

网关是个什么玩意?

是你对外请求的统一入口,做接受请求、分发请求用的,作为链接各个微服务的角色,你势必要使用到下游的若干个 RPC 服务。

你怎么办?

引入所有的服务提供方的 API 包,然后发起调用吗?

可以是可以,但是不够优雅。

你想,如果有一个服务提供方发布了新的 API 包,你也需要更新版本,重新发版?

或者新来一个服务提供者 E,你需要引入其 API 包,然后重新发版?

网关应该是一个稳定的基础服务,它提供的是聚拢 API 接口、转发调用的基础功能,不应该频繁发版,不应该主动去关注下游的服务接口变化。平台本身不应该依赖于服务提供方的接口 API。

不主动,才能更加优雅,也能让自己更加轻松。

那么怎么才能做到不主动关注呢?

这个事情,总有一方要主动的,所以网关层不主动,那么服务提供者就需要主动起来。

我们可以搞成这样:

网关层提供一个 API 接口发布平台,当服务提供者的接口有新增或者发生变化的时候,由对应系统的接口管理人员把接口信息,比如接口路径、方法、入参、出参、方法功能说明、方法负责团队、接口对接人等等这些消息维护到 API 接口发布平台上。

这样网关层就可以从 API 接口发布平台获取到所有服务的所有接口,并不需要引入任何服务提供者的 API 包。

这样就解决了“主动”的问题,如果接口有变化,请在 API 接口发布平台进行登记,从而解决了网关频繁发布的问题。

在官网上,除了网关的场景外,还提到一个测试平台的场景,道理是一样的,我就不赘述了:

https://cn.dubbo.apache.org/zh-cn/overview/mannual/java-sdk/advanced-features-and-usage/service/generic-reference/

解决了“主动”的问题,那么下一个问题就随之而来了:知道所有服务的所有接口然后呢,怎么发起调用呢?

这个时候泛化调用,啪的一下就站出来了:铺垫了这么多,终于该老子上场了。

泛化调用

啥是泛化调用呢?

在 Dubbo 官网上是这样介绍的:

首先需要强调的是“泛化调用”不是 Dubbo 特有的,它是一个功能,很多的框架都支持泛化调用,只是我这里用的 Dubbo 做演示而已。

老规矩,先花五分钟时间搭个 Demo 出来再说。

这个 Demo 我也是跟着网上的 quick start 搞的:

https://cn.dubbo.apache.org/zh-cn/overview/quickstart/java/spring-boot/

可以说写的非常详细了,你就跟着官网的步骤一步步的搞就行了。

我这个 Demo 稍微不一样的是我在消费者模块里面搞了一个 Http 接口:

在接口里面发起了 RPC 调用,模拟从前端页面发起请求的场景,更加符合我们的开发习惯。

为了起到强调作用,我再次把这个部分给你框起来:

DemoService 是 RPC 接口,它的实现类是这样的:

在我的消费者模块里面为什么能注入这个 DemoService 并调用它的 sayHello 方法呢?

因为我引入了对应的依赖包。

那么,如果我把这个依赖包去掉,也就是模拟我们前面说的“不主动”的动作,这个 DemoService 肯定会报错,找不到这个类:

那么我们应该怎么去修改一下这个 Demo,让它泛化起来呢?

非常简单:

注入 DemoService 修改为注入 GenericService。

有的小伙伴可能会问 GenericService 是怎么冒出来的?

你先别管它是怎么冒出来的,我现在是在给你铺垫 Demo,后面要撕给你看。你现在只需要知道它是 Dubbo 框架里面的包,并不会让你引用额外的包就行了:

现在 Demo 就算是搭好了,本地启动一个 zk,然后把服务提供者启动起来,再把消费者启动起来,最后轻轻的发起一个调用:

朋友,它不就跑起来了吗?

我没有引用接口的 api 包,我不也正常发起了调用,然后拿到了返回值吗?

啥原理

你就想,远程调用,你把一些花里胡哨的东西都拿掉之后,它的本质是什么?

本质就是帮助解决微服务组件之间的通信问题,不管是基于 HTTP、HTTP/2、TCP 还是什么其他的通信协议,解决的是网络连接管理、数据传输等基础问题。

虽然我没有引用 API 的对应的包,但是我前面我不是说了吗,我们有一个 API 接口发布平台,这个平台里面有接口维护人员提供的接口路径、方法、入参、出参这些关键信息。

所以我在调用的时候可以拿到相关的信息,以一种通用的方式,比如字符串的方式告诉 RPC 框架,我要调用的是 DemoService 接口的 sayHello 方法,入参是 String 类型的 world 字符串:

如果是你来开发一个 RPC 框架,调用方都把这些关键信息给你了,无非就是你帮忙多做几步类似于反射、序列化之类的处理。而处理的这个过程,就是泛化调用的过程。

泛化调用不是 Dubbo 特有的,但是具体到 Dubbo 这个框架里面,具体是这样的。

首先,Dubbo 里面有一层 Filter,这些 Filter 构成了一个 Filter 链条:

Filter 用来对每次服务调用做一些预处理、后处理动作,使用 Filter 可以完成访问日志、加解密、流量统计、参数验证等任务。

一次请求过程中可以植入多个 Filter,Filter 之间相互独立没有依赖。

从消费端视角,它在请求发起前基于请求参数等做一些预处理工作,在接收到响应后,对响应结果做一些后置处理。

从提供者视角,在接收到访问请求后,在返回响应结果前做一些预处理。

所以我们的泛化调用,也是通过下面这两个 Filter 来搞事情的:

  • org.apache.dubbo.rpc.filter.GenericFilter
  • org.apache.dubbo.rpc.filter.GenericImplFilter

那么问题就来了?

为什么要两个 Filter 呢?

因为要完成一次泛化调用,消费端和服务提供者都需要感知到并做相关的处理,所以一个是消费端的 Fliter,一个是服务提供者的 Fliter:

知道了对应的 Filter,关于泛化调用的所有秘密都藏在 Filter 对应的源码里面。

歪师傅带着你简单的看一眼。

GenericImplFilter.invoke

首先,我们在方法的消费者对应的 Fliter 的入口处打上断点:

org.apache.dubbo.rpc.filter.GenericImplFilter#invoke

可以看到分为了三个模块。

  • isCallingGenericImpl:calling a generic impl service,判断是否调用的是一个实现了泛化接口的接口。
  • isMakingGenericCall:making a generic call to a normal service,把泛化调用转换为一个常规调用。
  • invoker.invoke(invocation):常规调用。

我们研究的情况属于 isMakingGenericCall 这个分支。

既然是要把泛化调用转换为一个常规调用,那么 Dubbo 是怎么判断这是一个泛化调用的呢?

org.apache.dubbo.rpc.filter.GenericImplFilter#isMakingGenericCall

  • 判断本次调用的方法名称是否是 invokeAsync
  • 判断本次调用的入参个数是否是 3 个
  • 判断容器上下文中的 generic 参数是否对应着泛化调用的序列化方法。

我们一个个的看。

invokeAsync 方法是 GenericService 这个接口里面的方法。而这两个方法的入参个数都是三个。

然后有个 generic 参数,在我的 Demo 里面这个参数是 true:

当我啪的一下跟进到 isGeneric 方法中,才发现这里面别有洞天:

原来 generic 这个参数不只是可以为 “true”,它不同的值,代表着不同的序列化方式。

通过这部分源码可以看出来,泛化调用对于客户端,即在 GenericImplFilter 里面,并没有做什么特别的操作,注意还是参数校验。

如果入参和对应的序列化方法不能匹配起来,即使的抛出异常,这样符合 Dubbo 框架的 fast-fail 思想。

但是其实看到这里的时候,我有一个小疑问,如果我写一个这样的类:

public interface WhyService {
    Object $invoke(String a,String b,String c);
}

和 GenericService 类一样,有 $invoke 方法,而且也是三个参数。

然后在上下文中塞个 generic=true 进去,那么是不是也能骗过这段代码呢,也能进入到 isMakingGenericCall 方法里面呢?

从代码上看确实是这样的,那么 Dubbo 到底是怎么规避这些“恶意”冒充者的呢?

我也不知道。

先存个疑吧,接着往下看。

GenericFilter.invoke

我们同样在服务端打上断点,当这个请求来到服务端的时候,我们再看看服务端的情况。

org.apache.dubbo.rpc.filter.GenericFilter#invoke

可以看到这个方法逻辑都在 if 判断为 true 的时候。

而这个判断我们刚刚在客户端已经解析过了,只是多了一个判断:

!GenericService.class.isAssignableFrom(invoker.getInterface())

看看发起调用的接口类是不是 GenericService 类的子类,如果是,则进入到 if 分支里面。

朋友,这就有点意思了。几秒钟之前我们还在存疑,然后啪的一下疑问就解开了。

直接就是恍然大悟了。

我这个类:

public interface WhyService {
    Object $invoke(String a,String b,String c);
}

过不了服务提供者的 GenericFilter 里面的这个判断:

!GenericService.class.isAssignableFrom(invoker.getInterface())

在 invoke 方法里面,可以看到经过了一个 findMethodByMethodSignature 方法,获取了我们想要调用的 method 方法:

这个方法,从名字上也可以看出,是根据方法签名反射出具体的方法:

在服务端,是有 DemoService 接口对应的类的,所以可以通过反射找到它。

然后再解析出入参的具体值:

这样你就有了构建一个 RpcInvocation 对象,即发起 RPC 调用的对象的所有关键消息。

直接就是发动一招“狸猫换太子”的大动作,重新构建一个 RpcInvocation 对象,然后自己发起一个 invoke 调用。

这样整体看起来似乎一次泛化调用也是很简单的,当你去看服务提供端的源码的时候,你会发现这里面的源码特别多。

不过是因为 Dubbo 支持了多种不同的序列化方式而已,本质是一样的:

onResponse 方法也是同理,就不赘述了:

org.apache.dubbo.rpc.filter.GenericFilter#onResponse

到这里就算是扯下了泛化调用的神秘面纱,和我们预想的一样,无非是拿到接口调用的关键信息之后,重新构建一个请求而已,整体逻辑并不复杂。

复杂的逻辑是什么?

我演示的是最简单的,入参是一个 String 类型的情况。如果我是一个复杂对象呢,对象里面的成员变量特别多,对象里面套对象,对象里面有 List 或者 Map 的情况呢?

复杂的地方在于怎么处理这些复杂对象,把复杂对象搞成服务提供者的 Java 对象入参。

我这里只是一个导读而已,如果你对这部分有兴趣的话,自己搞个复杂对象去研究研究吧,老有意思了。

就当是家庭作业了。

意外收获

歪师傅在扯面纱的时候,没想到还有意外收获。

给你看一段代码,也是前面出现过的一个方法,我把完整的代码都截图放出来:

org.apache.dubbo.common.utils.ReflectUtils#findMethodByMethodSignature

你瞅瞅我框起来部分的 signature 字段,是不是没有任何卵用?

自信一点,不要怀疑,确实没有任何用处,signature 只是赋了个值而已,后续的代码中并没有使用。

所以,我小脑瓜子一转,立刻察觉到这又是一个水 pr 的好机会。

于是...

https://github.com/apache/dubbo/pull/13382

晚上 10 点半的时候,直接就是一个贡献源码的大动作,小手一挥,带走四行代码:

当时我没细想,但是后来躺在床上的时候我突然想起来:不应该啊,这个地方为什么会留着几行看起来是没有删除不干净的代码呢?

隐隐觉得这里面应该是有故事的。

于是看了这个类的提交记录,主要找两个地方:这个 signature 是什么时候有的,又是什么时候没的。

在 2012 年 6 月 15 日,针对这个类做了一次性能优化:

优化的具体内容就是用 Map 把方法缓存起来,以免每次都需要去走反射的逻辑。

看完这个提交之后我觉得很合理啊,使用 Map 缓存一下确实属于性能优化。

那么为什么又把这个 Map 拿走了呢?

于是我在 2021 年 9 月 6 日的提交中找到了拿走 Map 对应的提交记录:

这次提交的内容非常的多,而从提交记录的 log 中并没有找到为什么要移除这个 Map 的原因:

怎么办?

很简单,社区提问就行了。

于是我在我的 pr 下面抛出了自己的问题:

我查看了该类的提交历史,发现 #8684 删除了 ReflectUtils.java 中的所有 Map 缓存,遗留了对 signature 字段的处理。
但是我不明白为什么要删除缓存,在我看来应该保留缓存。能说一下官方是怎么考虑的吗?

很快我就得到了官方的回复:

删除缓存的原因是因为这些 Map 缓存是全局变量,这会导致从 Dubbo 的类(通常是 GC root)到对应类的引用,而这些类在 ClassLoader 被闲置后无法释放。

啥意思呢?

我大概的解释一下。

首先,我们看一下这个 Map 的定义是怎么样的:

private static final ConcurrentMap<String, Method> SIGNATURE_METHODS_CACHE = new ConcurrentHashMap<String, Method>();

它是个 static 对象,那么它是不是会被作为一个 GC root?

如果它作为一个 GC root,它里面缓存的这些方法,是不是都是“可达的”?

方法是可达的,那么这些方法对应的 Class 类是不是也是“可达的”?

但是在这些方法对应的 Class 类的 ClassLoader 完成自己的使命,被回收之后,那么这个 Class 类是不是理论上也可以被回收了?

但是实际情况是什么呢?

实际情况是因为这个 static 对象还持有其引用,导致它不会被回收。

基于这个考虑,官方决定移除这个 Map。

其实我个人觉得,如果我上面的理解没有错的话,那么讨论这个 Map 的效果,可以得两个分情况:

如果一个泛化调用的调用频率非常低,那么你把对应的方法缓存起来,导致 GC 一直回收不了,确实没啥意思。

如果一个泛化调用的调用频率比较高,那么你把对应的方法缓存起来,确实能起到“性能优化”的效果。

那么 Dubbo 作为一个框架怎么知道你的这个方法调用的频率高不高呢?

它也不知道,所以干脆不要替用户多做这一步,做多了,反而容易出错。

其实它也是可以知道的,比如可以提供一个参数给用户进行配置,把选择权给到用户,让用户通过配置来告诉你。甚至它可以不用用户提供信息,可以自己来做数据收集,来评判这个方法是否应该被缓存起来。

但是,这玩意收益也不高啊。

本来泛化调用就是比较小众的东西了,在这上面搞这么多心思,投入产出比不高啊。

有这时间,还不如想想主链路上还有没有什么地方可以优化优化,在主链路上干事情,才是收益最大的事情。

就像是你在公司里面,在边缘部门里面干得再出色,也很少能让人注意到。但是如果你在核心部门里面,做出一点稍微亮眼的成绩,大家都能看到。

所以,你以为你敲的只是代码吗?

不是的,你敲的,是人情世故。

最后,这个 pr 也合并到源码中去了,再次查看这个类的提交记录,你会发现一个熟悉的名称:

说真的,删除这三行代码没有任何技术含量,这部分代码让任何一个有 Java 基础的人来看,都会发现这个问题。

我不过是在调试源码的过程中捡了个漏而已。

但是为什么这部分代码存在了很久时间了,是我捡到了这个漏呢?

我想,大概是我真的搭了个 Demo 然后一行行的跟了一下源码吧。

所以,朋友,别只是看,要动手,说不定有意外收获。

标签:Dubbo,调用,泛化,接口,API,篇文章,方法
From: https://www.cnblogs.com/thisiswhy/p/17859011.html

相关文章

  • 解密Spring Cloud微服务调用:如何轻松获取请求目标方的IP和端口
    公众号「架构成长指南」,专注于生产实践、云原生、分布式系统、大数据技术分享。目的SpringCloud线上微服务实例都是2个起步,如果出问题后,在没有ELK等日志分析平台,如何确定调用到了目标服务的那个实例,以此来排查问题效果可以看到服务有几个实例是上线,并且最终调用了那个实......
  • ListView 的getView方法被频繁调用问题
    废话少说,没有标题##出现的原因分下面几种:因ListView的宽度或高度设为了wrap_content,导致系统需要不断地测量。解决:固定宽高设个具体值,或设置match_parent,或fill_parent,因情况不确定,没有标准答案,这几个可以都试试。父布局的宽度或高度设为了wrap_content,再加上ListView宽高更不......
  • Oracle 数据库存储过程调用SpringBoot API 接口方法
    数据库存储过程代码CREATEORREPLACEPROCEDUREFSMT.P_GET_HTTP_RES/*描述:存儲過程掉用HTTP接口作者:Janus日期:2023-11-23*/(M_DOC_NOINVARCHAR2,--??M_DOC_TYPEINVARCHAR2,--?据?型M_STANDBYINVARCHAR2,--?用字段M_EM......
  • C语言调用C++类成员函数讲解和实例
    原文:https://blog.csdn.net/LxXlc468hW35lZn5/article/details/1257010071、问题成因C语言与C++调用问题原因主要在于C编译器和C++编译器的不同。C是过程式语言,C编译器编译后,函数在符号库中就是函数名,没有其他任何附加信息。而C++是对象式语言,支持函数重载,C++编译器编译后,在符号......
  • 【C与C++的相互调用方法】
    原文:https://blog.csdn.net/qq_43899283/article/details/132343699C与C++的相互调用方法C与C++为什么相互调用的方式不同C++中调用CC中调用C++致谢C与C++为什么相互调用的方式不同  C和C++之间的相互调用方式存在区别,主要是由于C和C++语言本身的设计和特性不同。函数......
  • 调用labview生成的dll文件中包含 labview的2维数组作为输出输出时,如何操作
    以前使用python调用labview生成的dll时,如果直接使用labview本身的二维数组,程序就会自己崩溃,也无法使用,但由于二维本质就是一维,所以用的一维加行列可以解决这个问题,绕开了这个labview二维数组的结构但是最近有研究了一下,发现可以解决这个问题,现在记录如下,首先,从网上找到了一......
  • python 调用pg 存储过程
    Python调用pg存储过程![pg](引言PostgreSQL(简称pg)是一种开源的关系型数据库管理系统,它具有高度的可扩展性和灵活性,被广泛应用于大型企业级应用程序中。pg支持存储过程,通过存储过程可以将一系列SQL语句封装为一个可重复使用的代码块。本文将介绍如何使用Python调用pg存储过程。P......
  • C#调用C++类库的几种方式
    1、 直接调用C++类库中的公共方法使用DllImport特性对方法进行调用,比如一个C++类库SampleCppWrapper.dll中的公共方法:extern"C"__declspec(dllexport)int__stdcallAdd(intn1,intn2);__stdcall表示调用约定:参数都是从右向左通过堆栈传递, 函数调用在返回前要由被调......
  • SAP ABAP 动态生成 ABAP 程序并动态调用的例子代码试读版
    本文回答笔者知识星球一个朋友的提问:汪老师您好,请教一个问题。ABAP里的程序能够动态生成吗?我的意思是,ABAP程序的源代码是从第三方传入的,然后在ABAP系统生成,并执行?有没有类似的例子可以参考?谢谢汪老师!首先笔者要提醒的是,这种根据第三方输入,动态生成ABAP程序并且执行的方......
  • C++回调函数的定义和调用
    文章目录一、C++回调函数1.C/C++回调函数2.普通回调3.函数指针4.C++类的静态函数作为回调函数5.类的非静态函数作为回调函数6.Lambda表达式作为回调函数7.std::funtion和std::bind的使用二、其他参考资料 一、C++回调函数C++回调函数1.C/C++回调......