基于半监督学习的单体型组装算法

摘要：单体型组装(Haplotype Assembly)是根据测序得到的DNA片段通过各种模型算法来重建出生物个体的单体型。随着人类基因组计划(Human Genome Project,HGP)的逐渐完成,人们已经认识到个体之间基因序列的差异是造成个体之间各种表型差异的主要原因,如发色、体型、罹患疾病的不同风险程度等。因此分析个体的单体型在遗传领域有非常重要的意义,其主要应用有疾病诊断、药物研究等。如果能仅通过生物手段就获得个体正确的完整DNA序列,那么单体型组装问题是容易解决的。然而,在实际过程中,由于生物实验的的限制,通常仅能得到一些较短的DNA片段,并且实验中会不可避免地发生一些测序错误。因此,根据一些有测序错误的DNA片段并结合计算机技术来组装出错误最少甚至是正确的个体单体型既是目标,也是挑战。机器学习领域的半监督学习策略是一种科学利用无类标签数据的学习模式,由于有标签样本仅占少数,因此结合少量有标签数据和大量无标签数据来提高模型的学习性能是非常有必要的。基于以上,本文提出两种结合半监督学习的单体型组装算法。K均值算法(K-Means)是机器学习中非常经典的聚类算法,算法在迭代过程中...更多关键词：

单核苷酸多态性;单体型组装;半监督学习策略;K最近邻算法;K均值算法;

专辑：
信息科技
专题：
自动化技术
DOI：
10.27137/d.cnki.ghusu.2020.000288
分类号：
TP181

导师：

谢民主;

学科专业：

软件工程（专业学位）

硕士电子期刊出版信息：

年期：2021年第01期网络出版时间：2020-12-16——2021-01-15

文章目录

标签：基于,组装,监督,单体,学习,算法
From： https://www.cnblogs.com/wangprince2017/p/17473435.html

0001. Kmeans聚类算法
一、Kmeans原理Kmeans算法是一种常见的聚类算法，用于将数据集划分成k个不重叠的簇。其主要思想是通过迭代的方式将样本电话分到不同的簇中，使得同一簇内的样本点相似度较高，不同簇之间的相似度较低。Kmeans算法的详细步骤：初始化：选择k个初始聚类中心，可以是随机选择或者根据某种启......
算法题总结-分组背包
原题有N件物品和一个容量为V的背包。第i件物品的费用是Ci，价值是Wi。这些物品被划分为K组，每组中的物品互相冲突，最多选一件。求解将哪些物品装入背包可使这些物品的费用总和不超过背包容量，且价值总和最大。由于截止目前，没有刷到对应的经典题目，以下以依赖背包的转化题......
关于RL 和DRL中的算法总结
其中：RL分为基于价值的学习和基于策略的学习和AC架构的价值学习DQNDQN=Q_learing+网络使用了价值网络q(..w)DQN训练的过程基础的DQN就是训练Q网络更新w参数代码中梯度下降用的是下面这一张这里有个问题下面这张图片中有不一样的地方即Gradientdescent......
算法题总结-分组背包与依赖背包
原题https://www.nowcoder.com/practice/f9c6f980eeec43ef85be20755ddbeaf4?tpId=37&tqId=21239&rp=1&ru=/exam/oj/ta&qru=/exam/oj/ta&sourceUrl=%2Fexam%2Foj%2Fta%3Fdifficulty%3D1%26page%3D1%26pageSize%3D50%26search%3D%26tpId%3D37%26type%3D37&am......
算法学习day52动态规划part13-674、300、718
packageLeetCode.DPpart13;/***674.最长连续递增序列*给定一个未经排序的整数数组，找到最长且连续递增的子序列，并返回该序列的长度。*连续递增的子序列可以由两个下标l和r（l<r）确定，*如果对于每个l<=i<r，都有nums[i]<nums[i+1]，*那么子序列[nums[......
算法学习day53动态规划part14-1143、53、1035
packageLeetCode.DPpart14;/***1143.最长公共子序列*给定两个字符串text1和text2，返回这两个字符串的最长公共子序列的长度。*如果不存在公共子序列，返回0。*一个字符串的子序列是指这样一个新的字符串：它是由原字符串在不改变字符的相对顺序的情况下删除某些......
或许是一个新的算法方向？
动动发财的小手，点个赞吧！今日谷歌DeepMind使用深度强化学习发现更快的排序算法，相关论文成果已经发表在Nature上。据报道：该算法可以提速70％，相比之下，快了3倍之多。摘要排序或散列等基本算法在任何给定的一天都会被使用数万亿次。随着计算需求的增长，让这些算法尽可能高效变得至......
算法——最短路径算法(dijkstra)
source源端，target目的端1.构造n*n的相邻矩阵，-1表示未相邻intmatrix[n][n]intdist[n]初始化各节点直接到source的距离，dist[source]=0;boolvisited[n]是否访问过dist[source]=0;for(inti=0;i<n-1;i++){//找剩余n-1个节点的距离in......
【三维装箱】基于自适应遗传算法的三维集装箱装载问题研究附matlab代码
✅作者简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，matlab项目合作可私信。......
一致性哈希算法——算法解决的核心问题是当slot数发生变化时，能够尽量少的移动数据
一致性哈希算法摘自：http://blog.codinglabs.org/articles/consistent-hashing.html算法简述一致性哈希算法（ConsistentHashing）最早在论文《ConsistentHashingandRandomTrees:DistributedCachingProtocolsforRelievingHotSpotsontheWorldWideWeb》中被提出。简单来......

基于半监督学习的单体型组装算法

基于半监督学习的单体型组装算法

李明阳

湖南师范大学

文章目录

相关文章

赞助商

阅读排行