首页 > 其他分享 >服务治理-熔断,降级,限流,削峰,错峰

服务治理-熔断,降级,限流,削峰,错峰

时间:2023-08-22 16:46:45浏览次数:41  
标签:降级 请求 削峰 断路器 限流 pollyHttpClientConfig using 错峰

一、熔断【Circuit Breaker】

       1、简介

             熔断也叫断路器。作用类似家用保险丝,当某服务出现不可用或者响应超时,为防止整个系统出现雪崩,暂时停止该服务的调用。

二、降级【Fallback】

       1、简介

             当服务器压力增加,根据当前业务情况及流量,对部分服务业页面进行有策略的降级,以此释放服务器资源,来保证核心任务的正常运行。

             降级往往会指定不同的级别,根据不同的异常等级执行不同的处理:

                     根据服务方式:可以拒绝服务,可以延迟服务,可以随机服务。

                     根据服务范围:可以砍掉某个功能,也可以砍掉某些模块。

            总之服务降级需要根据不同的业务需求采用不同的降级策略。主要目的就是服务虽然有损,但是总比没有好。

       2、熔断VS降级

             相同点:

                         目标一致:都是从可用性和可靠性出发,防止系统崩溃。

                         用户体验类似:最终都让用户体验到某些功能暂不可用。

             不同点:

                         触发原因不同:服务熔断一般是某个服务(下游服务)故障引起的,而服务降级一般是从整体负荷考虑。  

三、限流【Bulkhead】

       1、简介

             限流可以认为是服务降级的一种。限流就是限制系统的输入和输出流量,来达到保护系统的目的。

            一般来说系统的吞吐量是可以被测算的,为了保证系统的稳定运行,一旦达到的需要限制阈值,就需要限制流量并采取一些措施来完成限制流量的目的。比如:延迟处理,拒绝处理,或者部分拒绝处理等。

        2、实现

             以Polly框架,Hystrix请参考:.NET Core + Spring Cloud:熔断降级

            【步骤一】添加 Microsoft.Extensions.Http.Polly 包        

//<1>、降级后的返回值
 HttpResponseMessage fallbackResponse = new HttpResponseMessage
{ 
       Content = new StringContent("降级,服务暂时不可用"),
       StatusCode = HttpStatusCode.InternalServerError,

}; 
//<2>、降级策略
var FallBackPolicy = Policy<HttpResponseMessage>.Handle<Exception>().FallbackAsync(fallbackResponse, async b =>
             {
                 // 1、降级打印异常
                 Console.WriteLine($"服务开始降级,异常消息:{b.Exception.Message}");
                 // 2、降级后的数据 
                 Console.WriteLine($"服务降级内容响应:{await fallbackResponse.Content.ReadAsStringAsync()}");
                 await Task.CompletedTask;
             });

            //<3>、熔断策略/断路器策略
            var CircuitBreakPolicy = Policy<HttpResponseMessage> // HttpResponseMessage 为HttpClient的返回值
                .Handle<Exception>() //捕获Exception异常
                .OrResult(res => res.StatusCode == HttpStatusCode.InternalServerError || res.StatusCode == HttpStatusCode.RequestTimeout)
                .CircuitBreakerAsync(
                    3,    // 出现3次异常
                    TimeSpan.FromSeconds(20), // 断路器的时间(例如:设置为20秒,断路器两秒后自动由开启到关闭)
                    (ex, ts) =>
                            {   //熔断器开启事件触发
                                Console.WriteLine($"服务断路器开启,异常消息:{ex.Result}");
                                Console.WriteLine($"服务断路器开启的时间:{ts.TotalSeconds}s");
                            }, //断路器重置事件触发
                    () => { Console.WriteLine($"服务断路器重置"); }, //断路器半开启事件触发
                    () => { Console.WriteLine($"服务断路器半开启(一会开,一会关)"); }
                 );

            //<4>、限流策略
            var bulk = Policy.BulkheadAsync<HttpResponseMessage>(
               maxParallelization: 30,//最大请求并发数
               maxQueuingActions: 20,//可以有20个请求在队列里排队 
               onBulkheadRejectedAsync: context =>//当我们的请求超出了并发数时怎么处理 这里可以定义自己的规则
               { 
                   return Task.CompletedTask;  
               }
             

               );

            services.AddHttpClient();
            services.AddHttpClient("myhttpclienttest", client =>
            {
                client.BaseAddress = new Uri("http://localhost:9002/");
                // client.Timeout = TimeSpan.FromSeconds(1);
            })
            //<5>、添加 降级策略
            .AddPolicyHandler(FallBackPolicy)
            //<6>、添加 熔断策略                                                      
            .AddPolicyHandler(CircuitBreakPolicy)
            //<7>、添加限流策略
            .AddPolicyHandler(bulk)
            ;
View Code

            注意:1、<3>熔断的策略里,加了 .OrResult(res => res.StatusCode == HttpStatusCode.InternalServerError || res.StatusCode == HttpStatusCode.RequestTimeout) ,网上的教程一般没有,这句话的意思是,当请求返回的状态是500服务器异常或者请求超时时,都计算在内。若没有这句话,对方接口必须要抛异常,才计算在内。

                       2、这些策略可以组合起来使用。

          【步骤二】HTTPClient调用远程接口服务        

using Microsoft.AspNetCore.Mvc;
using Microsoft.Extensions.Logging;
using System;
using System.Collections.Generic;
using System.Linq;
using System.Net;
using System.Net.Http;
using System.Threading;
using System.Threading.Tasks;

namespace HttpClientDemo.Controllers
{


    [ApiController]
    [Route("[controller]")]
    public class WeatherForecastController : ControllerBase
    {

        private readonly ILogger<WeatherForecastController> _logger;

        private readonly IHttpClientFactory _clientFactory;
        public WeatherForecastController(ILogger<WeatherForecastController> logger, IHttpClientFactory clientFactory)
        {
            _logger = logger;
            _clientFactory = clientFactory;

        }

        /// <summary>
        /// 测试HttpClient和Polly
        /// </summary>
        /// <returns></returns>

        [HttpGet]
        public async Task<MyResult> Get()
        {
            MyResult result = new MyResult();
            try
            {
               

                Console.WriteLine("请求处理开始。。。。");  
                var client = _clientFactory.CreateClient("myhttpclienttest"); 

                var request = new HttpRequestMessage(HttpMethod.Get, "api/values/testtimeout");
                HttpResponseMessage response = await client.SendAsync(request);
                var content = await response.Content.ReadAsStringAsync();
                if(response.StatusCode== HttpStatusCode.InternalServerError)
                {
                    result.code = "400";
                    result.msg = content;
                }
                else
                {
                    result.code = "200";
                    result.msg = content;
                }
                return result; 
            }
            catch (Exception ex)
            {
                result.code = "401";
                result.msg = ex.Message;
                Console.WriteLine($"出理异常:{ex.Message}");
                return result;
            }
        }
    }
}
View Code

            这里有坑,HTTPClient最后一定要返回的事HttpReaponseMessge,否则无法返回降级的返回内容。

           【步骤三】Polly在.NetCore项目中封装

             根据步骤一,我们将这些代码封装起来。使用配置文件来配置参数。

             新建配置文件:pollyconfig.json,并且将该json文件保存的格式为UTF-8,不然会有中文乱码

{
  "Polly": [
    {
      "ServiceName": [ "myhttpclienttest", "myhttpclienttest2" ], //服务名称,可以多个服务使用同一个配置
      "TimeoutTime": 5, //超时时间设置,单位为秒
      "RetryCount": 2, //失败重试次数
      "CircuitBreakerOpenFallCount": 2, //执行多少次异常,开启短路器(例:失败2次,开启断路器)
      "CircuitBreakerDownTime": 6, //断路器关闭的时间(例如:设置为2秒,短路器两秒后自动由开启到关闭)
      "HttpResponseMessage": "系统繁忙,请稍后再试!", //降级处理提示信息
      "HttpResponseStatus": 200 //降级处理响应状态码
    },
    {
      "ServiceName": [ "myhttpclienttest3" ], //假如服务名称存在相同的,则后面的会替换掉前面的
      "TimeoutTime": 2,
      "RetryCount": 5,
      "CircuitBreakerOpenFallCount": 2,
      "CircuitBreakerDownTime": 8,
      "HttpResponseMessage": "系统繁忙,请稍后再试~!",
      "HttpResponseStatus": 503
    }
  ]
}
View Code

             创建配置实体类:PollyHttpClientConfig.cs对应配置文件里的节点

public class PollyHttpClientConfig
{
    /// <summary>
    /// 服务名称
    /// </summary>
    public List<string> ServiceName { set; get; }
 
    /// <summary>
    /// 超时时间设置,单位为秒
    /// </summary>
    public int TimeoutTime { set; get; }
 
    /// <summary>
    /// 失败重试次数
    /// </summary>
    public int RetryCount { set; get; }
 
    /// <summary>
    /// 执行多少次异常,开启短路器(例:失败2次,开启断路器)
    /// </summary>
    public int CircuitBreakerOpenFallCount { set; get; }
 
    /// <summary>
    /// 断路器关闭的时间(例如:设置为2秒,短路器两秒后自动由开启到关闭)
    /// </summary>
    public int CircuitBreakerDownTime { set; get; }
 
    /// <summary>
    /// 降级处理消息(将异常消息封装成为正常消息返回,然后进行响应处理,例如:系统正在繁忙,请稍后处理.....)
    /// </summary>
    public string HttpResponseMessage { set; get; }
    /// <summary>
    /// 降级处理状态码(将异常消息封装成为正常消息返回,然后进行响应处理,例如:系统正在繁忙,请稍后处理.....)
    /// </summary>
    public int HttpResponseStatus { set; get; }
}
View Code

             封装拓展类:PollyHttpClientServiceCollectionExtension.cs

using Microsoft.Extensions.Configuration;
using Microsoft.Extensions.DependencyInjection;
using Polly;
using System;
using System.Collections.Generic;
using System.Linq;
using System.Net;
using System.Net.Http;
using System.Threading.Tasks;

namespace HttpClientDemo
{
    public static class PollyHttpClientServiceCollectionExtension
    {
        public static void AddPollyHttpClient(this IServiceCollection service)
        {
            //读取服务配置文件
            try
            {
                var config = new ConfigurationBuilder().AddJsonFile("pollyconfig.json").Build(); //nuget: Microsoft.Extensions.Configuration.Json
                List<PollyHttpClientConfig> configList = config.GetSection("Polly").Get<List<PollyHttpClientConfig>>(); // nuget: Microsoft.Extensions.Options.ConfigurationExtensions
                if (configList != null && configList.Count > 0)
                {
                    configList.ForEach((pollyHttpClientConfig) =>
                    {
                        service.AddPollyHttpClient(pollyHttpClientConfig);

                    });
                }
            }
            catch (Exception ex)
            {
                throw new Exception("请正确配置pollyconfig.json");
            }
        }
        public static void AddPollyHttpClient(this IServiceCollection service, PollyHttpClientConfig pollyHttpClientConfig)
        {
            if (pollyHttpClientConfig == null)
                throw new Exception("请配置:pollyHttpClientConfig");

            if (pollyHttpClientConfig.ServiceName == null || pollyHttpClientConfig.ServiceName.Count < 1)
                throw new Exception("请配置:pollyHttpClientConfig.Polly.ServiceName");

            for (int i = 0; i < pollyHttpClientConfig.ServiceName.Count; i++)
            {
                var builder = service.AddHttpClient(pollyHttpClientConfig.ServiceName[i]);

                builder.BuildFallbackAsync(pollyHttpClientConfig.HttpResponseMessage, pollyHttpClientConfig.HttpResponseStatus);
                builder.BuildCircuitBreakerAsync(pollyHttpClientConfig.CircuitBreakerOpenFallCount, pollyHttpClientConfig.CircuitBreakerDownTime);
                builder.BuildRetryAsync(pollyHttpClientConfig.RetryCount);
                builder.BuildTimeoutAsync(pollyHttpClientConfig.TimeoutTime);
            }
        }


        //降级
        private static void BuildFallbackAsync(this IHttpClientBuilder builder, string httpResponseMessage, int httpResponseStatus)
        {

            if (httpResponseStatus < 1 || string.IsNullOrEmpty(httpResponseMessage))
                return;

            HttpResponseMessage fallbackResponse = new HttpResponseMessage
            {
                Content = new StringContent(httpResponseMessage),
                StatusCode = (HttpStatusCode)httpResponseStatus
            };

            builder.AddPolicyHandler(Policy<HttpResponseMessage>.HandleInner<Exception>().FallbackAsync(fallbackResponse, async b =>
            {
                // 1、降级打印异常
                Console.WriteLine($"服务开始降级,异常消息:{b.Exception.Message}");
                // 2、降级后的数据
                Console.WriteLine($"服务降级内容响应:{await fallbackResponse.Content.ReadAsStringAsync()}");
                await Task.CompletedTask;
            }));
        }
        //熔断
        private static void BuildCircuitBreakerAsync(this IHttpClientBuilder builder, int circuitBreakerOpenFallCount, int circuitBreakerDownTime)
        {
            if (circuitBreakerOpenFallCount < 1 || circuitBreakerDownTime < 1)
                return;

            builder.AddPolicyHandler(
                           Policy<HttpResponseMessage> // HttpResponseMessage 为HttpClient的返回值
                           .Handle<Exception>() //捕获Exception异常
                           .OrResult(res => res.StatusCode == HttpStatusCode.InternalServerError || res.StatusCode == HttpStatusCode.RequestTimeout)
                           .CircuitBreakerAsync(
                               circuitBreakerOpenFallCount,    // 出现3次异常
                               TimeSpan.FromSeconds(circuitBreakerDownTime), //10秒之内; 结合上面就是:10秒之内出现3次异常就熔断   
                               (res, ts) =>
                               {   //熔断器开启事件触发
                                   Console.WriteLine($"服务断路器开启,异常消息:{res.Result}");
                                   Console.WriteLine($"服务断路器开启的时间:{ts.TotalSeconds}s");
                               }, //断路器重置事件触发
                               () => { Console.WriteLine($"服务断路器重置"); }, //断路器半开启事件触发
                               () => { Console.WriteLine($"服务断路器半开启(一会开,一会关)"); }
                               )
                       );

        }
        //失败重试
        private static void BuildRetryAsync(this IHttpClientBuilder builder, int retryCount)
        {
            if (retryCount > 0)//失败重试
                builder.AddPolicyHandler(Policy<HttpResponseMessage>.Handle<Exception>().RetryAsync(retryCount));
        }
        //超时
        private static void BuildTimeoutAsync(this IHttpClientBuilder builder, int timeoutTime)
        {
            if (timeoutTime > 0)//超时
                builder.AddPolicyHandler(Policy.TimeoutAsync<HttpResponseMessage>(TimeSpan.FromSeconds(timeoutTime)));
        }
    }
}
View Code

             在startup.cs类的ConfigureServices方法中注册,放在所有命名模式的HttpClient客户端注册之后。

services.AddPollyHttpClient();
View Code

            HttpClient调用远程接口服务的方法不变。

四、流量错峰、流量限流、流量削峰

      服务端每秒流量处理能力是通过QPS衡量的,最大QPS(峰值)就是对服务器抗压能力的衡量指标,如果来自客户端的流量超过了服务端的最大QPS,要么服务端发生宕机,要么将超过能力范围的请求忽略掉,返回限流错误给客户端,两者都造成用户体验的崩塌和品牌受损。

     策略概括起来就是3点:错峰、限流、削峰。本质上都是为了降低QPS。

        

          4.1、流量错峰

               “错峰”,就是将请求峰值错开,服务端的QPS峰值可以看做一系列小QPS峰值请求的叠加,通过技术手段错开小峰值,有效降低最大QPS。

               可以从服务端和客户端两个维度错峰。

              【服务端错峰策略】

               如果触发客户端的请求动作是通过服务端主动下发实现的,比如PowerMsg支持服务端主动下发,那么服务端可以分批下发给客户端(假设所有服务端到客户端的时延RT是一样的)。

             

            

              【客户端错峰策略】

                常用的客户端错峰策略采用的是随机算法,假设所有客户端接收要触发请求动作的时间t0是一样的,给定一个时间T,客户端采用随机延迟,t时刻再去触发请求动作,其中t在[0,T]时间段内随机。

                

                 从大量数据来看,这个公式可以保证 t 在区间 [0, T] 之间均匀分布。那么理论上新的最大QPS等于老的最大QPS除以T。

                

                          

            4.2、流量限流

              服务端基本都会做限流,比如Mtop限流之后返回对应的限流错误码。下面主要介绍客户端限流。客户端限流主要目标是消除频繁或不必要的请求。

                a、用户已经到达最大请求次数,就不去请求;

                b、用户已经被限流,则延迟再去第二次请求;

                c、用户已经拿到所要的返回结果,则不再去请求。

            4.3、流量削峰

                  削峰,就是消除峰值的最大QPS,有几种削峰策略。

                   【设置两次请求的最小有效时间间隔】

                    设置两次请求最小有效时间间隔,假设最小时间间隔是t,那么在小于t的时间的请求都视为无效请求,忽略掉。像红包雨这类频繁请求的活动,该策略非常有效。

           

                  例如上图,红色是有效请求,灰色是无效请求,灰色也就不会向服务端发送请求。假设t秒内只有一次有效请求,那么1秒内,有1/t次有效请求,用户量是Q,那么最大QPS如下(假设所有的用户都是同时开始请求,间隔时间一致):

                                               

                   【概率请求策略】

                     如果不想每次都让用户去请求,给用户请求的动作加一个概率P,那么每次发送请求的概率就是P,这个时候需要结合3.1的策略去控制用户的每秒请求次数。最大QPS公式如下:

                                                 

                       通过控制t和P的值,就可以灵活控制最大QPS范围。这里有一个问题,就是根据概率容易产生极端请求,比如:

 

          

                         大量数据就容易产生大量的极端请求,违反公平性原则,就需要用到公平性策略。

              【公平性策略】            

               这里提供一种公平性策略的方式,随机算法+插值算法,生成有效请求序列。

    每个用户一次活动周期内有效请求概率是P,比如概率0.2,也就是5次中1次请求机会,或者10次中2次请求机会。根据随机算法+插值算法生成请求序列

              

        

                根据上述方式就可以得到公平性策略,粒度可以精准把控。

                小结:通过上述错峰、限流、削峰,达到降低QPS的目的。通常,一场大促销需要上述几种方案的结合。

               其他:使用事件总线框架CAP实现削峰

 

标签:降级,请求,削峰,断路器,限流,pollyHttpClientConfig,using,错峰
From: https://www.cnblogs.com/xiaobaicai12138/p/17648924.html

相关文章

  • 只需5分钟,了解常见的四种限流算法
    一、计数器算法在指定周期内累加访问次数,当访问次数达到设定的阈值时,触发限流策略,当进入下一个时间周期时进行访问次数的清零。如图所示,我们要求3秒内的请求不要超过150次:但是,貌似看似很“完美”的流量统计方式其实存在一个非常严重的临界问题,即:如果第2到3秒内产生了150次请求,而......
  • 限流保护——IIS限流插件
    1.安装IISa.打开"开始"——“控制面板”——“程序”——“程序和功能”——“打开和关闭windows功能”b.在“InternetInformationServices”下勾选需要的设置(具体设置可自行百度,测试可直接点击“InternetInformationServices”前的复选框)c.在"控制面板"......
  • Django实现文件上传、文件列表查看、修改、限流和日志记录8
    Django实现文件上传、文件列表查看、修改、限流和日志记录8本章节,总结一些部署项目遇到的报错,希望会有所帮助NameError:name'datetime'isnotdefined报错“logging.info('用户{}在{}登录成功'.format(username,datetime.now()))NameError:name'datetime'isnotd......
  • Django实现文件上传、文件列表查看、修改、限流和日志记录7
    Django实现文件上传、文件列表查看、修改、限流和日志记录7不管调用的接口在内网,还是外网都需要做好限制保证接口的访问和限流降级处理,本章节新增限流功能。限流功能主要针对两个方面:IP和用户针对IP限流文件列表接口进行限流处理,限制每分钟每个IP访问10次,你可以使用Dja......
  • Django实现文件上传、文件列表查看、修改、限流和日志记录6
    Django实现文件上传、文件列表查看、修改、限流和日志记录6对于已经上传的文件,现在已经实现了文件的查看修改,美中不足的是:需要查看每个文件需要提前记住文件名指定文件名进行查看和修改。为此,新增一个上传文件的列表功能,在通过模版按钮跳转路由到查看和修改页面。实现逻辑查看......
  • Django实现文件上传、文件列表查看、修改、限流和日志记录4
    Django实现文件上传、文件列表查看、修改、限流和日志记录4本章添加用户认证功能,属于安全模块。用户认证在Django中,默认情况下,用户的用户名和密码是存储在数据库中的。Django提供了内置的用户模型(User模型),它可以管理用户的认证和授权。配置数据库在file_upload/settings.py......
  • Django实现文件上传、文件列表查看、修改、限流和日志记录2
    Django实现文件上传、文件列表查看、修改、限流和日志记录2本章节优化新增功能使用ssh秘钥连接远程服务器进行文件上传使用ssh私钥连接远程服务器上传文件使用SSH私钥连接远程服务器并上传文件,你可以使用paramiko库来实现SSH连接和文件传输的功能。首先,确保你已经生成了SSH......
  • Django实现文件上传、文件列表查看、修改、限流和日志记录1
    Django实现文件上传、文件列表查看、修改、限流和日志记录1上一章已经实现了文件的上传到项目的指定目录中,这章我们继续乘胜追击继续优化实现。一般都是上传文件到后端服务器上,因此需要建立一个远程服务器的连接,本章连接远程服务器实现文件上传实现点击上传本地文件到远程服务......
  • Django实现文件上传、文件列表查看、修改、限流和日志记录
    Django实现文件上传、文件列表查看、修改、限流和日志记录本章先简单实现文件的上传,后续会将标题的功能一一添加上去实现,并且给出远程服务器的不同连接方式【密码和秘钥】,欢迎继续关注。安装了Django框架pipinstalldjango 创建一个Django项目django-adminstartproj......
  • go-zero 是如何实现令牌桶限流的?
    原文链接:go-zero是如何实现令牌桶限流的?上一篇文章介绍了如何实现计数器限流?主要有两种实现方式,分别是固定窗口和滑动窗口,并且分析了go-zero采用固定窗口方式实现的源码。但是采用固定窗口实现的限流器会有两个问题:会出现请求量超出限制值两倍的情况无法很好处理流量突增......