首页 > 其他分享 >风控决策引擎——决策流构建实战

风控决策引擎——决策流构建实战

时间:2023-12-20 22:15:00浏览次数:38  
标签:实战 flow 决策 风控 节点 digester 决策树

引言

本篇主要聚焦介绍风控决策引擎中决策树编排能力的构建。决策引擎是风控的大脑,而决策树的编排能力和体验是构建大脑的手段,如何构建高效、丝滑、稳定可靠的决策树编排能力,是对风控决策引擎的一大挑战,本篇文章和大家分享一下过往构建心得。

背景

任何系统在初期构建肯定不是往“一步到位”的方向去构建的,只是架构设计者尽量向后期可扩展、可维护的方向去搭建。好的底层设计,不怕产品后期疯狂迭代,且改动调整方便。糟糕的“填鸭式”代码,可能在当时为了尽快实现了功能,最终也会逐步发展成“屎山”,维护成本越来越高,要么跑路,要么只能另起炉灶。

MVP 小步迭代 1.0

此阶段目标:最小化可行产品(MVP);小布迭代,快速上线;一人分饰多角色。

风控部门成立初期,人员少,缺少 UED 和 前端,毕竟风控本身对视觉设计和前端不是刚需,主要是后端研发和策略运营对抗黑产即可。此时为了能尽快上线决策树功能,研发人员本着小步快跑的思想,直接在代码层资源目录 resource 下放置决策树静态配置文件(具体实现在下文分解),每次更改都需要发版。本身引擎的构建也是不完善的,需要添加的功能很多,一周发个几版也是家常便饭的事,此阶段大家也是能接受的。

“由静转动”2.0

此阶段目标:无需发版,生产快速变更;稳定性相关考虑。

随着部门队伍的逐步壮大,以及研发流程的规范,风控策略运营人员对于决策编排的响应时效和可视化能力需求越来越迫切,对于研发需要发版才能部署新的决策能力现状不满,黑产是高效的,但是研发发版又是需要编排和时间的,大家都要发版,且集中在一个发版周期,策略周一提出的修改,待到周三和大家的需求一起上,此时黑产早撸完跑路了。同时发版是有一定的风险的,出错了需要立即回滚,此时又延误了策略上线的时间。

基于上述,我们考虑到是时候开放生产环境直接可视化的编排决策树能力了,但是我们没有前端的同学,找别的部门借可能又不熟悉决策引擎这一套流程规范,沟通成本还高。那折中了一个方案:将静态配置文件挪到 DB 存储中去,且配置以文本字符的形式展现在前端即可,不需要复杂的前端设计,只需要简单的表单文本框填充即可满足研发修改决策流的诉求。这样让原本静态的配置“动”起来,直接在生产可配置,大大提高了生产部署的效率。

可视化决策流编排 3.0

此阶段目标:高效、稳定、智能的可视化决策树编排能力产品构建

接入风控的业务线越来越多,研发人员忙于风险场景对应的变量开发迭代,此时还需要分出一部分精力负责修改决策树。2.0 版本的决策树对运营来说就是一段字符串,不是一棵树,策略运营是没办法修改,也不敢修改,出错的风险太大。考虑到整个风控的体量和模式已经非常稳定了,也有一定的时间去考虑将决策编排做成一个可视化的产品交付策略人员使用了,毕竟决策树的调整本身也是策略的职责之一,需要将此沉淀为一个高可用的产品。

我们参照了业内 BPMN 工作流的前端样式设计规范,摘取了在风控决策树种需要用到的元素,构建了自己的决策引擎智能编排能力,可视化的拖拽节点,可完全交付给策略人员自行配置使用。

设计实现

技术选型

决策树,实际上就是一个变种 DAG(有向无环图),图中的节点在业务层面有不同的属性及功能。

那么如何存储这个 DAG 结构呢?用二维数组存储,是不能满足节点属性及边属性要求的,一是边界没法定义,可能这棵树很大,二是假设属性由关联表来实现,就会很割裂,没法直观看得到。

其实图可以用链表表示,链表的存储结构第一反应就是 JSON 或者 XML 来表示。可以想象, 如果用 JSON 来表示的话,层级嵌套关系会非常繁琐,毕竟 JSON 是用来序列化数据用的,展示方面,还是 XML 添加属性更为方便直观。

数据结构

举例简易决策树如下

如上决策树用 XML 数据结构表示如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<flow id="test01" desc="建议决策流">

<!-- 开始节点 -->
<start id="start">

<!-- 链接到下一节点 -->
<link to="black01"/>
</start>

<!-- 名单节点 -->
<nameList id="black01" desc="黑名单">

<!-- 名单属性:名单类型:黑/白/灰;领域类型;适用范围 -->
<field key="type" val="black"/>
<field key="domain" val="10001,10002"/>
<field key="scope" val="deviceHash,phone,uid"/>
<link to="split01"/>
</nameList>

<!-- 分流节点 -->
<split id="split01" desc="是否为微信渠道">

<!-- 条件分支 -->
<condition order="0" desc="是" expr="system == 'wechat'" to="strategy01"/>
<condition order="10" desc="否" to="strategy02"/>
</split>

<!-- 策略节点 -->
<strategy id="strategy01" desc="微信专属策略">

<!-- 关联专属策略元数据 -->
<field key="strategyGuid" val="25F7C71A5F834F24A12C478CEE4CB9EB"/>
<link to="end"/>
</strategy>
<strategy id="strategy02" desc="非微信渠道策略">
<field key="strategyGuid" val="0FC8A95A4D6A4F169C77950BB4A98D80"/>
<link to="end"/>
</strategy>

<!-- 结束节点 -->
<end id="end" desc="结束"/>
</flow>

上述数据结构非常直观的表示了当前需要绘制的决策树数据结构,相较于 JSON 的数据表现形式,XML 更灵活,扩展更方便,在横向和深度上可以有较好的平衡。

决策流解析

XML 是很成熟的技术实现了,市面上有很多解析 XML 的开源实现,如上数据结构我使用 common-digester解析,POM 中引入如下依赖即可:

1
2
3
4
5
6
<!-- https://mvnrepository.com/artifact/commons-digester/commons-digester -->
<dependency>
<groupId>commons-digester</groupId>
<artifactId>commons-digester</artifactId>
<version>1.8.1</version>
</dependency>

实体关系如下:

XML 数据解析如下:

1
2
3
4
5
6
7
8
9
@Data
public class FlowEntity {
private String id;
private String desc;

private INode startNode;

private Map<String, INode> nodeMap = new HashMap<>();
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
Digester digester = new Digester();

// parse flow node
digester.addObjectCreate("flow", FlowEntity.class);
digester.addSetProperties("flow");

// parse start node
digester.addObjectCreate("flow/start", StartNode.class);
digester.addSetProperties("flow/start");

// 在 FlowEntity 实现 addNode 方法,将当前节点录入
digester.addSetNext("flow/start", "addNode");
digester.addObjectCreate("flow/start/link", LinkBranch.class);
digester.addSetProperties("flow/start/link");

// 在 StartNode 实现 addLink 方法,将当前边录入
digester.addSetNext("flow/start/link", "addLink");

// parse split node
digester.addObjectCreate("flow/split", SplitNode.class);
digester.addSetProperties("flow/split");
digester.addSetNext("flow/split", "addNode");
digester.addObjectCreate("flow/split/condition", ConditionBranch.class);
digester.addSetProperties("flow/split/condition");

// 在 SplitNode 实现 addCondition 方法,将当前条件录入
digester.addSetNext("flow/split/condition", "addCondition");

// 省略...

InputStream inputStream = new ByteArrayInputStream(xmlResource.getBytes());
return (FlowEntity) digester.parse(inputStream);

其中 addNode 逻辑为将所有节点都存储在一个 nodeMap 结构内,并且如果当前节点是开始节点,则赋值到
startNode节点。

当 XML 解析完后,此时关联关系还没有建立,轮询每个节点后将节点与节点之间联系起来,并且校验节点是够存在,确保能关联成一个树。

1
2
3
4
5
6
7
8
9
10
11
public void assembleToNode(Map<String, INode> nodeMap) {
if (Objects.isNull(nodeMap)) {
return;
}

if (!nodeMap.containsKey(this.to)) {
throw new RuntimeException(String.format("%s to: %s can't find node from nodeMap", this.desc, this.to));
}

this.toNode = nodeMap.get(this.to);
}

决策流执行

决策的执行只需要从 startNode 执行开始,递归执行,直到找到唯一的出口弹出即可。注意,策略接口是有输出决策结果的,如果是拒绝的话,此时可以直接中断流程执行,返回结果即可。

1
2
3
4
5
6
7
8
9
10
11
@Override
public void execute(FlowContext context) {

// 出口
if (this instanceof EndNode) {
return;
}

// 递归执行
this.execute(context);
}

其中,SplitNode节点执行需要计算条件表达式,只要满足一个条件,即可确定往下走的节点,子类覆盖实现如下:

注:条件表达式我之前单独发了一篇文章,感兴趣的话欢迎关注,可在我的历史文章归档中查找,此处就不在展开说明了。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
@Override
public void execute(FlowContext context) {

Validate.notEmpty(condition, "node id: {} desc: {} [condition] is empty", this.getId(), this.getDesc());

// 主动判断
Optional<ConditionBranch> target = condition.stream().filter(c -> c.evaluate(context)).findFirst();

// TODO: 考虑返回默认兜底分支节点
if (!target.isPresent()) {
throw new RuntimeException("node id: {} ConditionBranch expr execute find nothing, please check your expr condition");
}

target.get().getToNode().execute(context);
}

StrategyNode 节点执行原理和 SplitNode 一致,只需要子类覆写实现方法,去执行相应的规则引擎,获取到决策结果,即可判断走向,此处就不在列出。

如上设计好了决策树的存储结构,再配合前端同学构建的基于 BPMN 流图的样式配合,定制风控需要的节点信息和表达,即可随时构建一棵理想的树(此处一句话带过,但在丝滑编排和辅助校验上,前端同学付出了很多,当然这不是本篇文章的重点)。

总结

本文分享了决策引擎中决策流图的思考及构建过程,从最小可用产品上线支撑业务发展到沉淀出可视化编排能力的工作区。当然,本文仅仅展示了通用决策流的思考构建过程,显示业务中还是会遇到各种挑战,比如对性能的要求、对成本的控制等等,挑战非常多,我将在后续一一分享出来,欢迎关注。

往期精彩

标签:实战,flow,决策,风控,节点,digester,决策树
From: https://www.cnblogs.com/ExMan/p/17917696.html

相关文章

  • 【业务安全实战演练】业务流程乱序测试07
    一、流程乱序测试1、测试原理和方法该项测试主要针对业务流程的处理流程是否正常,确保攻击者无法通过技术手段绕过某些重要流程步骤,检验办理业务过程中是否有控制机制来保证其遵循正常流程。例如业务流程分为三步:第一步,注册并发送验证码;第二步,输入验证码;第三步,注册成功。在第三......
  • 我是怎么入行做风控的
    引言常听到周围有人说“风控”这个词,只知道这是一个神秘的部门,对他们做的事却一知半解,只知道这个风控部门对公司非常重要,任何活动和信息都最好向风控部门报备以评估风险,尤其涉及到钱的问题。到底什么是风控?为什么需要风控?风控到底在干什么?本文将向你解惑。什么是风控风控,即风......
  • 从0到1智能风控决策引擎构建
    引言互联网时代,万物互联,网络安全形势越来越严峻,安全是企业的基石,风控在企业中扮演着“警察”角色,运用各种技术和手段,保护企业内的用户利益不受侵害。风控决策引是风控中台的入口,提供业务风险场景事件接入,可视化编排复杂决策,丰富的特征变量与场景识别服务等功能。相较于需要开发背......
  • Java 并发编程在生产应用场景及实战
    背景介绍为什么需要学习Java并发?从提升性能角度来说提升了对CPU的使用效率:目前生产的服务器大多数都是多核,标配的机器都是8C/16G。操作系统会将不同的线程分配给不同的核心处理,理论上,有多少核心就有多少个线程并行执行。如果没有并发编程,CPU的利用率将极大的浪费,假设当......
  • 搭建风控规则引擎
    作者:是咕咕鸡链接:https://www.zhihu.com/question/65314241/answer/2707684336来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。引言互联网时代,万物互联,网络安全形势越来越严峻,安全是企业的基石,风控在企业中扮演着“警察”角色,运用各种技术和手段......
  • 【中小型企业网络实战案例 一】规划、需求和基本配置
    原创:厦门微思网络案例拓扑图案例需求在中小园区中,S5735通常部署在网络的接入层,S8700通常部署在网络的核心,出口路由器一般选用AR系列路由器。核心交换机配置VRRP保证网络可靠性,配置负载分担有效利用资源。每个部门业务划分到一个VLAN中,部门间的业务在CORE上通过VLANIF三层互通。核心......
  • 【算法】决策树算法:ID3
    importmathfromcollectionsimportCounter#创建数据集defcreate_dataset():dataset=[#年龄,工作,房子,信用,标签['青年',0,0,'一般','0'],['青年',0,0,'好','0'],[�......
  • 构建陪诊预约系统:技术实战指南
    在医疗科技的飞速发展中,陪诊预约系统的应用为患者和陪诊人员提供了更为便捷和贴心的服务。本文将带领您通过技术实现,构建一个简单而实用的陪诊预约系统,以提升医疗服务的效率和用户体验。技术栈选择在开始之前,我们需要选择适用于陪诊预约系统的技术栈:前端:使用React.js构建交互界面......
  • 【Pytorch基础实战】第二节,卷积神经网络
    项目地址https://gitee.com/wxzcch/pytorchbase/tree/master/leason_2源码importtorchfromtorchimportnn,optimfromtorch.autogradimportVariablefromtorch.utils.dataimportDataLoaderfromtorchvisionimportdatasets,transforms#定义一些超参数batch_......
  • Unity 3D定点数物理引擎实战系列1.1BEPUphysicsint 3D定点数物理引擎介绍
    1.1BEPUphysicsint3D定点数物理引擎介绍对惹,这里有一个游戏开发交流小组,希望大家可以点击进来一起交流一下开发经验呀帧同步的游戏中如果用物理引擎,为了保证不同设备上的结果一致,需要采用定点数来计算迭代游戏过程中的物理运算。也就是我们通常说的定点数物理引擎(确定性物理......