首页 > 其他分享 >标签评分:海量标签如何进行系统治理?

标签评分:海量标签如何进行系统治理?

时间:2022-10-13 14:38:25浏览次数:44  
标签:次数 海量 标签 指标 评分 维度 优化

本篇是「标签画像系列」的第四篇,此前我们已经介绍过了标签画像体系建设方法论、标签体系设计与加工、标签加工与落库,这次我们来介绍一下「标签评分」。

标签评分是标签治理的一个重要措施,通过给标签打分,可清晰直观的从各个维度评估标签,掌握标签真实使用情况,进行标签持续优化,助力业务运营。同时,也能帮助数据团队判断哪些标签更应该投入计算与存储资源,合理规划集群资源。

一、为何要使用标签评分?

经过前期标签体系设计、标签加工,标签终于可以上线,让业务人员使用,发挥价值了!

随着标签上线一段时间后,我们开始关心每天占用计算资源与存储空间,跑出来的上百个标签,业务同学真的用到了多少,业务收益是否能覆盖数据成本呢?标签上线后,其质量怎么样,是否存在老规则不适用、需要持续优化的情况?

带着这一问题,我们需要用一种方法来评估标签上线后的使用情况,标识各个标签的价值。参考电影评分、花呗评分等形式,我们决定也给标签打个分、排个序,简单明了。

二、标签评分模型

标签评分模型,经过考虑我们选取了 5 个维度作为评分入参:

标签评分:海量标签如何进行系统治理?_权重

 标签总评分 = a * 标签使用度评分 + b * 标签关注度评分 + c * 标签质量评分 + d * 标签持续优化读评分 + e * 标签安全度评分

其中标签使用度、标签关注度、标签质量、标签持续优化度作为核心维度,标签安全度可根据实际情况考虑是否纳入。a、b、c、d、e 是权重,总和为 100%。

01 标签使用度评分

标签使用度,用以评估标签被分析、外部系统的使用情况。

在袋鼠云标签产品中,标签有这几种使用场景:

・标签引用:如原子标签被衍生标签应用、衍生标签被组合标签引用等,基于该场景,计算 “标签引用次数” 指标。

・标签分析:标签在标签圈群、群组画像、群组对比、显著性分析等画像分析功能中被分析的情况,计算 “标签分析次数” 指标。

・标签调用:标签通过数据 API 被外部应用查询的次数,计算 “标签调用次数” 指标。

基于以上 3 个指标,我们首先采用 Sigmoid 函数将指标转化为评分,再将各个指标的评分加权汇总成标签使用度评分。

标签评分:海量标签如何进行系统治理?_数据_02

 

标签评分:海量标签如何进行系统治理?_搜索_03

02 标签关注度评分

标签关注度,用以评估被搜索、查看、收藏的情况。

袋鼠云标签产品中,标签关注度与以下场景有关:

・标签搜索:标签在标签市场被用户搜索的情况,计算 “标签搜素次数” 指标。

・标签查看:标签被点击查看基础信息、分析页面等的次数,计算 “标签查看次数” 指标

・标签收藏:收藏该标签的用户数,计算 “收藏用户数” 指标

以上 3 个指标可反映标签的关注热度,我们依然采用 Sigmoid 函数将指标转化为评分,再将各个指标的评分加权汇总成标签关注度评分。

标签评分:海量标签如何进行系统治理?_权重_04

03 标签质量评分

标签质量,用以评估用户被打标情况,反映标签规则的合理性。

当我们定义了标签和标签值,经过计算之后,标签值打在用户身上的很少,那说明我们的规则执行不合理。比如我们定义了 “活跃度” 这个标签,分为 “高活跃、中活跃、低活跃度” 等,但真实被打上的这个标签的用户,低于 70%,还有很大一部分比例是空值,未打上该标签,说明我们制定的标签值规则有漏洞,需要完善。

系统将计算每个标签的 “标签覆盖度”,将覆盖度归一化为分数,转化成评分。

标签评分:海量标签如何进行系统治理?_权重_05

04 持续优化度评分

持续优化度,用以评估标签上线后,是否后续再去优化该标签。

在客户的生命周期中,不断有新用户流入、沉默用户流失。公司战略调整、产品发布等都会影响客户行为,这些变化我们需要以数据的方式呈现,所以我们需要不断根据业务调整、客户变化调整我们的标签策略,以追求可通过标签直接地、迅速地反映客户情况,指导业务运营。

持续优化度,我们通过 “标签优化次数” 指标来评估,指标签上线后标签被编辑再次发布的的次数。我们同样采用 Sigmoid 函数将指标转化为评分。 

标签评分:海量标签如何进行系统治理?_数据_06

05 安全度评分

标签安全度,不能反映标签的热度,但也将其作为了标签评分的一个维度,可根据企业情况考虑是否纳入。

在袋鼠云标签产品中,标签安全相关的策略有:

・标签的可见度:标签可编辑、可查看的用户范围

・标签使用是否需要申请授权:标签发布后,其他人使用该标签,是否需要申请审批

・标签是否进行行级权限控制:上面我们控制了标签的列权限,行级权限反映该标签是否设置了行级权限

・标签是否脱敏:标签是否进行脱敏

根据标签的安全度策略配置情况,我们也采用评分的方式来评估。

标签评分:海量标签如何进行系统治理?_权重_07

基于以上 5 个维度的评分,我们根据前面提的公式加权汇总,得到总评分。

标签评分:海量标签如何进行系统治理?_数据_08

三、标签评分的应用

基于标签评分,为了更加直观的让标签管理员、业务人员查看热门标签、沉默标签等,通过排行榜的方式呈现:

01 热门标签排行榜

基于标签的使用度、关注度、持续优化度 3 个角度来计算标签的热门评分,展示 TOP N 的热门标签。

标签评分:海量标签如何进行系统治理?_搜索_09

02 沉默标签排行榜

热门的标签的反向排序便是沉默标签,沉默标签说明这些标签使用率很低,可考虑定期下线,节省集群资源。

标签评分:海量标签如何进行系统治理?_权重_10

03 综合排行榜

综合排行榜便根据标签的综合评分进行排序,从标签使用度、关注度、持续优化度、质量、安全等几个维度评估,全面评估标签。

标签评分:海量标签如何进行系统治理?_数据_11

04 标签使用度、关注度、持续有优化度、质量、安全分榜单排行

用户可根据自己更加关注的维度,查看标签使用度、关注度、持续优化度、质量、安全各个子维度的排行榜。同时,可查看各个标签的具体指标,如使用度维度,可查看各个标签的当前引用次数、分析次数、调用次数,针对具体指标具体分析,满足不同的标签分析场景。

标签评分:海量标签如何进行系统治理?_权重_12

标签评分模型上线后,我们需要根据实际情况调整不同维度的权重,符合自身实际情况。当经过一段时间的应用,大家认可这套评估逻辑之后,便可以将静态化的评分展示转化为动态化的告警、自动化治理等,可设置标签质量告警、评分告警,自动通知标签管理员、责任人等。

以上便是在产品中应用的评分逻辑,希望对大家有所帮助,也可提出不同思路优化评分模型,达到更好的标签治理效果。


标签:次数,海量,标签,指标,评分,维度,优化
From: https://blog.51cto.com/u_15137832/5753370

相关文章

  • 标签评分:海量标签如何进行系统治理?
    本篇是「标签画像系列」的第四篇,此前我们已经介绍过了标签画像体系建设方法论、标签体系设计与加工、标签加工与落库,这次我们来介绍一下「标签评分」。标签评分是标签治理......
  • 当定位的元素在iframe标签中
        1、先切换进入到iframe中driver.switch_to.frame(0)  #0表示要进入到第几个iframe中再执行操作 2、后续操作没在iframe中时需要先切换回top中drive......
  • 海量数据库的查询优化及分页算法方案
     随着“金盾工程”建设的逐步深入和公安信息化的高速发展,公安计算机应用系统被广泛应用在各警种、各部门。与此同时,应用系统体系的核心、系统数据的存放地――数据库也随着......
  • 微信weixin-js-sdk(开放能力-微信开放标签)
    https://developers.weixin.qq.com/doc/oplatform/Mobile_App/WeChat_H5_Launch_APP.html   http://t.zoukankan.com/Can-daydayup-p-15404964.html  最后排查......
  • HTML5之input标签的新type属性
    新type属性介绍首先让我们来看一张表HTML5中的type.png其中标有`红色5`的代表`HTML5`中推出的测试代码:<!DOCTYPEhtml><htmllang="en"><head><metacharset="......
  • HTML基础知识与常用标签
    HTML目录HTML1.HTML文件的基础结构2.HTML标签2.1标签基础2.2常用标签meta标签实体(转义字符)标题标签超链接标签列表标签img标签音频标签表格标签iframe框架标签表单......
  • iview框架form表单内的select标签存在的校验问题
    近期做项目发现,iview框架的select框,选中值之后,没能通过表单的必填校验...仔细看了下,目前我们项目是请求的数据list的id作为key值来进行渲染,这个id是个number类型的0.0OK,......
  • 基于Ernie-3.0 CAIL2019法研杯要素识别多标签分类任务
    相关项目:​​Paddlenlp之UIE模型实战实体抽取任务【打车数据、快递单】​​​​Paddlenlp之UIE分类模型【以情感倾向分析新闻分类为例】含智能标注方案)​​​​应用实践:分类......
  • PaddleNLP基于ERNIR3.0文本分类以中医疗搜索检索词意图分类(KUAKE-QIC)为例【多分类(
    相关项目链接:​​​Paddlenlp之UIE模型实战实体抽取任务【打车数据、快递单】​​​​Paddlenlp之UIE分类模型【以情感倾向分析新闻分类为例】含智能标注方案)​​​​应用实......
  • 标签模板和标签函数
    标签模板和标签函数标签模板标签模板是提取出普通字符串与变量,交由标签函数处理letlesson='css';letweb='后盾人';tag`访问${web}学习${lesson}前端知识`;f......