首页 > 其他分享 >Knative的服务管理组件Serving

Knative的服务管理组件Serving

时间:2023-01-25 15:44:31浏览次数:41  
标签:Serving 请求 修订版 Knative 组件 Pod Autoscaler

Knative的服务管理组件Serving是管理应用服务的理想选择,它通过自动缩容为零和基于HTTP负载自动扩展的方式简化了部署流程。Knative平台可管理应用服务的部署、版本、网络、扩缩容。

Knative Serving通过HTTP URL的方式来暴露服务,有许多默认的安全设置。在特定的使用场景下,我们需要调整这些默认值,或者调整服务版本之间的流量分配来满足需求。由于Knative Serving具有自动缩容为零的能力,因此称其为Serverless。

Serving的架构设计

Knative Serving建立在Kubernetes和Istio的基础上,支持Serverless应用和函数的部署与管理。Knative Serving易于上手并且可扩展,以便支持高级使用场景。

Knative Serving提供中间件原语来实现以下能力。

·快速部署无服务器容器。

·自动扩缩容机制,支持缩容到零。

·基于Istio组件的服务路由和网络编程。

·部署代码的时间点快照以及配置管理。

Knative Serving支持以下容器化的工作负载。

·Function:传统FaaS的函数应用。通过将传统FaaS平台运行时框架与函数应用一起封装到容器中,实现对FaaS函数应用的支持。

·微服务:满足单一职责原则、可独立部署升级的服务。Knative非常适合用来部署和管理微服务。

·传统应用:主要指传统无状态的单体应用。虽然Knative不是运行传统应用的最佳平台,但支持传统无状态应用的部署。

Knative Serving定义了一套CRD对象。这些对象用于定义和管理Serverless工作负载在集群中的行为,如下所示。

Knative Serving对象模型 

1)服务(Service):service.serving.knative.dev资源自动管理用户工作负载的整个生命周期。它控制路由和配置对象的创建,在服务更新时确保应用有对应的服务路由、配置和新的修订版。服务可以被定义为总是把流量路由到最新的修订版或特定修订版。

2)路由(Route):route.serving.knative.dev资源用于映射一个网络端点到一个或更多修订版。你可以用多种方式来管理流量,包括分流和命名路由。

3)配置(configuration):configuration.serving.knative.dev资源维护了部署应用的最终状态。它遵循云原生应用12要素原则,提供了代码和配置分离的机制。每次修改配置会创建一个新的修订版。

4)修订版(Revision):revision.serving.knative.dev资源是在每次变更工作负载时生成的代码和配置的时间点快照。修订版是不可变对象。系统会保留有用的修订版本,删除不再使用的修订版。修订版对应的Pod实例数量会根据流量的大小自动进行伸缩。

 Knative相关的Kubernetes Service

Knative Serving组件包含4个Kubernetes Service和2个Deployment,构成了Serving的整体管理能力。

1)Activator(Service):负责为不活跃状态的修订版接收并缓存请求,同时报告指标数据给Autoscaler。在Autoscaler扩展修订版之后,它还负责将请求重试到修订版。

2)Autoscaler(Service):接收请求指标数据并调整需要的Pod数量以处理流量负载。

3)Controller(Service):协调所有公共Knative对象,自动扩展CRD。当用户请求一个Knative Service给Kubernetes API时,Controller将创建对应配置和路由,并将配置转换为revision,同时将revision转化为Deployment和KPA。

4)Webhook(Service):拦截所有Kubernetes API调用以及所有CRD的插入和更新操作,用来设置默认值,拒绝不一致和无效的对象,验证和修改Kubernetes API调用。

5)networking-certmanager(Deployment):协调集群的Ingrese为证书管理对象。

6)networking-istio(Deployment):协调集群的Ingress为Istio的虚拟服务。

Autoscaler的工作流程

Serverless的重要特点之一就是请求驱动计算。当没有请求时,系统不会分配相应的资源给服务。Knative Serving支持从零开始扩容,也支持缩容到零。在初始状态下,修订版的副本是不存在的。客户端发起请求时,系统要完成工作负载的激活。

1.Knative的扩缩容流程

Knative的扩缩容流程如下所示。

Knative自动扩缩容的架构图 

1)初次请求流程:客户端请求通过入口网关转发给Activator,然后由Activator为不活跃状态的修订版接收并缓存请求,同时报告指标数据给Autoscaler,接着由Autoscaler创建修订版的Deployment对象,接着由Deployment对象根据Autoscaler设定的扩展副本数创建相应数量的Pod副本。一旦Pod副本的状态变为Ready,Activator会将缓存的客户端请求转发给对应的Pod副本。Gateway然后会将新的请求直接转发给相应的Pod副本,不再转发给Activator。

2)持续请求流程:修订版副本中的Queue Proxy容器会不断报告指标数据给Autoscaler,由Autoscaler根据当前的指标数据情况不断调整修订版的副本数量。

3)缩容到零的流程:当一定时间周期内没有请求时,Autoscaler会将Pod副本数设置为零,回收Pod所占资源。同时,Gateway会将后续请求路由到Activator,如果后续请求出现,则触发初次请求流程。

2.扩缩容算法

Autoscaler默认基于Pod接收到的并发请求数扩缩容资源。Pod并发请求数的目标值(target)默认为100。计算公式是:Pod数=并发请求总数/Pod并发请求数的目标值。如果Knative服务中配置并发请求数的目标值为10,且加载了50个并发请求到Knative服务,Autoscaler就会创建5个Pod。

为了快速响应负载的变化,同时避免过度响应负载变化导致频繁创建销毁Pod,Autoscaler实现了两种模式的缩放算法:稳定模式(Stable)和恐慌模式(Panic),如下所示。

Autoscaler的两种工作模式 

1)稳定模式:在稳定模式下,Autoscaler自动调整Deployment的大小,以实现每个Pod所需的平均并发数。Pod的并发数是根据60秒窗口期内接收到的所有数据请求的平均数计算得出的。

2)恐慌模式:Autoscaler计算60秒窗口期内的平均并发数,系统需要在60秒内稳定在所需的并发级别。与此同时,Autoscaler也会计算6秒的窗口期内的平均并发数,一旦该窗口期内平均并发数达到目标并发数的2倍,则会进入恐慌模式。在恐慌模式下,Autoscaler将在时间更短、对请求更敏感的紧急窗口工作。紧急情况持续60秒后,Autoscaler将返回初始的60秒稳定窗口。

Queue Proxy

Knative服务对应的Pod里有两个容器,分别是User Container和Queue Proxy。User Container为Knative服务中定义的业务容器,包含应用程序及其依赖的运行环境。Queue Proxy是系统容器,以Sidecar方式存在。

Knative Serving为每个Pod注入Queue代理容器(Queue Proxy)。该容器负责向Autoscaler报告用户容器流量指标。Autoscaler接收到这些指标之后,会根据流量指标及相应的算法调整Deployment的Pod副本数量,从而实现自动扩缩容。

Queue Proxy各端口的定义如下。

·8012:Queue Proxy代理的HTTP端口,访问应用流量的入口。

·8013:HTTP2端口,用于gRPC流量的转发,未使用。

·8022:Queue Proxy管理端口,如健康检查等。

·9090:Queue Proxy容器的监控端口,数据由Autoscaler采集,用于实现基于请求的自动扩缩容。

·9091:Queue Proxy采集到的应用监控指标(请求数、响应时长等),由Prometheus采集。

以HTTP1请求为例,介绍Queue Proxy的工作原理。

业务流量首先进入Istio Gateway,然后被转发到Queue Proxy的8012端口,然后由Queue Proxy 8012端口把请求转发到User Container的监听端口,至此一个业务请求的服务就完成了,如下所示。

Queue Proxy的工作原理 

标签:Serving,请求,修订版,Knative,组件,Pod,Autoscaler
From: https://www.cnblogs.com/muzinan110/p/17067002.html

相关文章

  • Tekton组件及资源对象
    Tekton由如下7个组件构成1)TektonPipeline:TektonPipeline是Tekton的基础组件,定义了一组Kubernetes自定义资源。作为构建模块的基础,你可以使用它们装配CI/CD流水线。2)Tek......
  • 云边协同CloudCore组件
    CloudCore架构CloudCore通过List/Watch的方式与云交互,将监听到的事件下发到边缘,同时负责接收边缘以事件的形式上报的状态数据。这些功能是由CloudCore中的不同模块完成的......
  • 管理边缘负载EdgeCore组件
     EdgeCore架构EdgeCore包含的功能模块比较多,包括EdgeHub、MetaManager、DeviceTwin、EventBus、Edged、EdgeMesh、CSI和CNI。接下来逐个对其进行解析。1)EdgeHub:KubeEdg......
  • 与终端设备交互Mapper组件
    Mapper架构从与KubeEdge边部分EdgeCore对接的协议划分,终端设备可以分为通过MQTT协议进行对接的终端设备和通过HTTP进行对接的终端设备。1)通过MQTT协议进行对接的终端设......
  • 在React中,怎么用tailwind css(就叫顺丰吧 :D 。。。)封装Button组件
    我的目的想用tailwindcss来快速封装Button组件,而不是从更大型的UI库导入一个Button组件(那样就太大材小用)。几个工具从这抄的样式在学习怎么形成规范化的组件额,仅......
  • Hive SQL Join关联查询Apache Hadoop概述Hadoop YARN架构、组件及其交互流程Apache Hi
    Hadoop离线是大数据生态圈的核心与基石,是整个大数据开发的入门。本次分享内容让初学者能高效、快捷掌握Hadoop必备知识,大大缩短Hadoop离线阶段学习时间,下面一起开始今天的学......
  • Pyton 2.7 环境下PIP安装第三方组件
    由于ArcGIS与Python版本兼容性问题,目前仍然在使用Python2.7,安装第三方组件十分不便。安装PIP由于Python2.7版本较老,默认不像3.0自带pip,需要手动安装。安装步骤:(1)将C:\Pyt......
  • 4.Prometheus组件node_exporter
    1.node_exporter介绍2.二进制部署node_exporter3.docker部署node_exporter1.node_exporter介绍Node-exporter可以采集机器(物理机、虚拟机、云主机)的监控指标数据,能够......
  • vue:v-model (原生组件与自定义组件)
    vue2:原生组件 vue2:自定义组件 vue3:自定义组件vue3更改了vue2声明自定义组件的方式,将vue2中的value替换成了modelValue,将emit触发的事件名改为'update:model......
  • Vue3中的异步组件defineAsyncComponentAPI的用法示例
    介绍当我们的项目达到一定的规模时,对于某些组件来说,我们并不希望一开始全部加载,而是需要的时候进行加载;这样的做得目的可以很好的提高用户体验。为了实现这个功能,Vue3中为我......