首页 > 其他分享 >BSLTR-规则的层次化挖掘

BSLTR-规则的层次化挖掘

时间:2024-03-16 18:11:21浏览次数:28  
标签:层次化 index Chain Precedence BSLTR 挖掘 Response seq constraints

根据提供的描述,我们可以明确三种简单顺序约束和三种链式顺序约束,以及它们之间的层次关系,用于在数据集中挖掘有意义的活动模式。下面,我将基于这些描述,为每种约束类型提供一个具体的挖掘逻辑实现。

简单顺序约束

  1. Response(a, b): 最后一个b出现在最后一个a之后。
  2. Precedence(a, b): 第一个b出现在第一个a之后。
  3. Succession(a, b): 同时满足Response和Precedence约束。

链式顺序约束

  1. Chain Response(a, b): 任何一个a之后紧接着就是b。
  2. Chain Precedence(a, b): 任何一个b之前紧接着就是a。
  3. Chain Succession(a, b): 同时满足Chain Response和Chain Precedence约束。

层次化约束

  • 链式约束被视为更强调的约束,可以覆盖对应的简单顺序约束。

实现

假设我们有一个活动序列,下面是如何根据上述描述实现约束挖掘的伪代码:

def find_constraints(sequences):
    constraints = []

    for seq in sequences:
        # 检测Response(a, b)和Chain Response(a, b)
        if "b" in seq and "a" in seq:
            last_a_index = seq.rfind('a')
            last_b_index = seq.rfind('b')
            if last_b_index > last_a_index:
                constraints.append('Response(a, b)')
                if seq[last_a_index + 1] == 'b':
                    constraints.append('Chain Response(a, b)')
        
        # 检测Precedence(a, b)和Chain Precedence(a, b)
        if "b" in seq and "a" in seq:
            first_a_index = seq.find('a')
            first_b_index = seq.find('b')
            if first_b_index > first_a_index:
                constraints.append('Precedence(a, b)')
                if seq[first_b_index - 1] == 'a':
                    constraints.append('Chain Precedence(a, b)')
        
        # 检测Succession(a, b)和Chain Succession(a, b)
        if 'Response(a, b)' in constraints and 'Precedence(a, b)' in constraints:
            constraints.append('Succession(a, b)')
        if 'Chain Response(a, b)' in constraints and 'Chain Precedence(a, b)' in constraints:
            constraints.append('Chain Succession(a, b)')

    # 层次化减枝
    if 'Chain Response(a, b)' in constraints:
        constraints.remove('Response(a, b)')
    if 'Chain Precedence(a, b)' in constraints:
        constraints.remove('Precedence(a, b)')
    if 'Chain Succession(a, b)' in constraints:
        constraints.remove('Succession(a, b)')

    return constraints

请注意,上述代码是一个高级概念性的伪代码示例,主要用于说明如何基于序列数据实现这些约束的检测逻辑。在实际应用中,实现这些约束挖掘可能需要更复杂的逻辑,尤其是在处理大型序列数据集时。此外,实际代码需要能够处理活动序列的具体表示方式,以及可能存在的多种活动类型。

标签:层次化,index,Chain,Precedence,BSLTR,挖掘,Response,seq,constraints
From: https://www.cnblogs.com/csjywu01/p/18077385

相关文章

  • 【数据挖掘】家庭用电预测——数据清洗与数据分析
    任务利用一个家庭的用电量,来预测这个家庭未来的用电量。学会了这一个例子,如果有电网数据,就可以开发出适合各种业务需求的模型。比如: 通过预测各时段各区域的用电量来协助电网更好地实现电能调度 用于新能源电站(光伏、风力、水电)发电量预测数据集数据集来源:加州大......
  • 【数据挖掘】实验2:R入门2
    实验2:R入门2一:实验目的与要求1:熟悉和掌握R数据类型。2:熟悉和掌握R语言的数据读写。二:实验内容1:R数据类型【基本赋值】Eg.1代码:x<-8x Eg.2代码:a='city'a【缺省值】Eg.1代码:(1)生成向量z;(2)返回z的结果;(3)识别z的值是否有缺失值。z<-c(1:5,NA)zis.na(......
  • 【数据挖掘】实验1:R入门(内含详细R和RStudio安装教程)
    实验1:R入门一:实验目的与要求1:根据上课PPT内容,掌握课堂知识并进行代码练习操作,提供练习过程和结果。2:可COPY代码运行结果直接提交,如涉及到输出图等可截图。二:实验内容1:R语言的下载与安装1.1:安装R语言从清华镜像网站(TheComprehensiveRArchiveNetwork)处下载Windows版......
  • 管道挖掘新篇章:切面可视化技术的智慧应用
    在城市化进程不断加速的今天,地下管道作为城市“生命线”的重要组成部分,其安全、高效运行显得尤为关键。然而,传统的管道挖掘与检测方式往往存在着诸多不足,如效率低下、安全隐患大等。如今,随着技术的飞速发展,可视化技术为我们打开了一扇透视地下世界的智慧之窗。 管道挖掘切面可......
  • SEO优化要怎样去挖掘长尾关键词?#蜘蛛池SEO
    SEO优化要如何挖掘长尾关键词?无论是做百度SEO优化还是谷歌SEO优化,在搜索引擎SEO优化中,挖掘长尾关键词是一项至关重要的任务,接下来我们一起了解一下如何挖掘长尾关键词(8zySEO)?川圣SEO八爪鱼SEO?baidu搜索:如何联系八爪鱼SEO?挖掘长尾关键词是SEO优化中的关键步骤,因为这些关键词......
  • BSLTR-初始化向量的优化
    要使得初始化的用户向量X在训练过程中得到优化,我们需要对前述示例进行一些修改,确保X是一个可训练的参数。在PyTorch中,这意味着我们需要将X定义为一个Parameter或者设置requires_grad=True。然而,由于X代表原始数据,通常我们不直接将其视为模型参数进行优化。相反,我们优化模型来学习......
  • ETL的数据挖掘方式
    ETL的基本概念数据抽取(Extraction):从不同源头系统中获取所需数据的步骤。比如从mysql中拿取数据就是一种简单的抽取动作,从API接口拿取数据也是。数据转换(Transformation):清洗、整合和转化原始数据以适应目标存储或分析系统的阶段。从mysql中拿到数据之后对数据进行处理,像对数据的......
  • API电商接口大数据分析与数据挖掘 (商品详情店铺)
    API接口、数据分析以及数据挖掘在商品详情和店铺相关的应用中,各自扮演着重要的角色。以下是关于它们各自的功能以及如何在商品详情和店铺分析中协同工作的简要说明。API接口API(应用程序接口)是一种允许不同软件应用程序相互通信的方式。在商品详情和店铺分析的上下文中,API接口可......
  • 数据挖掘概念与技术 - chapter 8 - 分类:基本概念
    分类是一种重要的数据分析形式,提取刻画重要数据类的模型。分类器:用预测类标号数据分类:学习阶段(构建分类模型)与分类阶段(使用模型预测给定数据的类标号)训练集:由数据库元组和与它们相关联的类标号组成。元组X用n维属性向量X=(x1,x2,...,xn)表示。分别描述元组在n个数据库属性A1,A2,.......
  • MATLAB数据挖掘用改进的K-Means(K-均值)聚类算法分析高校学生的期末考试成绩数据
    全文链接:http://tecdat.cn/?p=30832原文出处:拓端数据部落公众号本文首先阐明了聚类算法的基本概念,介绍了几种比较典型的聚类算法,然后重点阐述了K-均值算法的基本思想,对K-均值算法的优缺点做了分析,回顾了对K-均值改进方法的文献,最后在Matlab中应用了改进的K-均值算法对数据进行了......