首页 > 其他分享 >AngClust:基于角度特征的短时间序列基因表达谱聚类(时间序列数据的聚类软件)

AngClust:基于角度特征的短时间序列基因表达谱聚类(时间序列数据的聚类软件)

时间:2024-12-01 10:55:55浏览次数:11  
标签:表达 AngClust 基因 https 聚类 序列 数据

中文关键词:

时序数据聚类,时间序列数据聚类,基因表达数据聚类,机器学习,角度特征

 

中文摘要:

在对基因表达进行聚类时,预计同一聚类中基因的相关系数很高,大多数聚类的基因本体(GO)富集分析将具有重要意义。然而,现有的短期基因表达聚类算法存在局限性。为了解决这个问题,我们提出了一种基于角度特征的短期基因表达聚类方法。我们的方法(称为AngClust)使用角度特征来指示两个相邻时间点基因表达水平的趋势变化。多个时间点的角度变化反映了整体表达水平的趋势变化。这些变化用于衡量不同基因的表达趋势是否相似。为了从聚类结果中获得功能显著的聚类,我们评估了聚类中的基因数量、平均相关系数、波动及其与GO项富集的相关性。AngClust在酵母基因表达数据集上的疗效优于其他两种测量方法,即欧几里德距离(ED)和动态时间扭曲相关性(DTW)。在人类、小鼠和酵母基因表达的时间序列上,AngClust簇富集的GO和通路项的比率高于或等于STEM和TMixClust。

该聚类算法(软件)适用于下列各类时序数据的聚类,该软件有可视化操作界面(Windows GUI),操作简介快捷。

 气温数据:例如每小时或每天记录的气温数据。
 股票价格:如每分钟、每小时或每日记录的股票交易价格。
 销售数据:如每月、每季度或每年的销售额。
 生物医学信号:如心电图、脑电图等,记录生物体的生理状态随时间的变化。
 交通流量数据:如每小时或每天记录的交通流量数据。
 天气数据:包括温度、湿度、风速等随时间变化的信息。


官网论文:

https://ieeexplore.ieee.org/document/9833353/    

https://pubmed.ncbi.nlm.nih.gov/35853049/

 

下载论文全文pdf文件(download full-text):

https://www.researchgate.net/publication/362119062_AngClust_Angle_Feature-Based_Clustering_for_Short_Time_Series_Gene_Expression_Profiles

或者,发邮件给作者获取全文pdf     liaiminmail@gmail.com

 

下载开源代码:

https://github.com/emanlee/angclust

https://sourceforge.net/projects/angclust/

 

引用论文:

Aimin Li, Siqi Xiong, Junhuai Li, Saurav Mallik, Yajun Liu, Rong Fei, Hongfang Zhou, Guangming Liu. AngClust: Angle Feature-Based Clustering for Short Time Series Gene Expression Profiles.  2023. IEEE/ACM transactions on computational biology and bioinformatics / IEEE, ACM. 2023 Mar-Apr;20(2):1574-1580. doi: 10.1109/TCBB.2022.3192306. Epub 2023 Apr 3. DOI: 10.1109/TCBB.2022.3192306 

 

标签:表达,AngClust,基因,https,聚类,序列,数据
From: https://www.cnblogs.com/emanlee/p/18579614

相关文章

  • BWO-CNN-BiGRU-Attention白鲸优化算法优化卷积神经网络结合双向门控循环单元时间序列
    BWO-CNN-BiGRU-Attention白鲸优化算法优化卷积神经网络结合双向门控循环单元时间序列预测,含优化前后对比目录BWO-CNN-BiGRU-Attention白鲸优化算法优化卷积神经网络结合双向门控循环单元时间序列预测,含优化前后对比预测效果基本介绍模型描述程序设计参考资料预测效......
  • 电话号码的字母序列
    题目描述输入一个仅包含数字2-9的字符串,输出所有它能表示的字母序列。给出数字到字母的映射如下(与电话按键相同)。注意1不对应任何字母。输入输入一个包含数字2-9的字符串,长度不超过6。输出按字典序输出所有能表示的字母序列,每行输出一个。输入样例23输出样例ad......
  • 最长递增子序列的个数 - 中等难度
    *************C++TOPIC:673.最长递增子序列的个数-力扣(LeetCode)*************先看题目:中等困难,之前做的是最长递增子序列,跟这个很像,先来复习一下找一下思路://这个逻辑比较的简单//就是说我直接定义dp数组,代表第i位最长递增数列的个数//遍历每一个元素//找到最......
  • MATLAB实现基于RF随机森林的时间序列预测-递归预测未来(多指标评价)
    目录MATLAB实现基于TF随机森林的时间序列预测-递归预测未来(多指标评价)1项目背景介绍...1项目目标与意义...2项目挑战...2项目特点与创新...2项目应用领域...3项目效果预测图程序设计...3项目模型架构...4项目模型描述...4项目模型算法流程图...6项目结......
  • 序列到序列的学习 (seq2seq - 词嵌入 - Embedding层 - mask掩码 - 后续会加入注意力机
    目录0.前言1.编码器 (encoder)补充1:词嵌入(WordEmbedding)补充2:嵌入层(EmbeddingLayer)2.解码器(decoder)3.损失函数4.训练5.预测6.预测序列的评估(BLEU)7.小结0.前言课程全部代码(pytorch版)已上传到附件本章节为原书第9章(现代循环网络),共分为8......
  • Java反序列化 - CC6链 (代码审计)
    一、漏洞简述:相比较于CC6链,CC1链对jdk版本有较多的限制。在jdk_8u71版本之后,AnnotationInvocationHandler类中的readObject方法代码被修改,移除了原有的setValue()方法,导致利用链断开。jdk_8u65:jdk_8u71:二、CC6链分析:1、利用逻辑:Hashmap.readObject()->Hashmap.hash()......
  • Day49 | 动态规划 :线性DP 判断子序列&&两个字符串的删除操作
    Day49|动态规划:线性DP判断子序列&&两个字符串的删除操作动态规划应该如何学习?-CSDN博客动态规划学习:1.思考回溯法(深度优先遍历)怎么写注意要画树形结构图2.转成记忆化搜索看哪些地方是重复计算的,怎么用记忆化搜索给顶替掉这些重复计算3.把记忆化搜索翻译成动态规......
  • C#反序列化XML时提示XML 文档(1, 1)中有错误
    最近在反序列化一个XML时,遇到了如下报错: XML文档(1,1)中有错误。内部异常XmlException:根级别上的数据无效。第1行,位置1。 看描述应该是XML格式的问题,我把XML复制到新建的控制台程序,反序列化又是可以的。代码如下:1internalclassProgram2{3stati......
  • 非子串的子序列
     #include<bits/stdc++.h>usingnamespacestd;intmain(){intn,q;cin>>n>>q;strings;cin>>s;boolflag[n]={true},flag2[n]={true};inta,b,p,num=0,c=0;while(q--){......
  • 代码随想录 -- 动态规划 -- 最长回文子序列
    516.最长回文子序列-力扣(LeetCode)思路:dp数组的含义:dp[i][j]:字符串s从i到j的最长回文子序列的长度为dp[i][j]递推公式:当s[i]=s[j]时:dp[i][j]=dp[i+1][j-1]+2当s[i]!=s[j]时:dp[i][j]=max(dp[i][j-1],dp[i+1][j])初始化:当i=j时:dp[i][j]=1遍历顺序:从下到上,从左到右最......