首页 > 数据库 >生物信息学数据库分类

生物信息学数据库分类

时间:2024-04-03 19:33:15浏览次数:23  
标签:信息学 DNA 数据库 分类 核酸 序列 链接 蛋白质

生物信息学数据库

在这里插入图片描述

(一)文献数据库

1、PubMed:拥有超过两百六十万生物医学文献的数据库,这些文献来源于MEDLINE,也就是生物医学文献数据库、生命科学领域学术杂志、以及在线的专业书籍。链接:PubMed (nih.gov)

PubMed存在的问题

(1)搜索1995年前文献中排名是为以后的作者
(2)搜索1976年以前的文献是没有摘要的
(3)1965年前的文献较难搜索

(二)一级核酸数据库

1、※GenBank:是美国国家生物技术信息中心(National Center for Biotechnology Information ,NCBI)建立的DNA序列数据库,从公共资源中获取序列数据,主要是科研人员直接提供或来源于大规模基因组测序计划。为保证数据尽可能的完全,GeneBank与EMBL(欧洲EMBL-DNA数据库)、DDBJ(日本DNA数据库)共同构成国际核酸序列数据库合作联盟(INSDC),三大数据库的信息每日相互交换,更新汇总。链接:GenBank Overview (nih.gov)
  2、ENA:ENA Browser

ENA:欧洲核苷酸序列数据库(European Nucleotide Archive),由欧洲分子生物学研究室(European Molecular Biology Laboratory,EMBL)开发并维护。

3、DDBJ:DDBJ

DDBJ是日本DNA数据库(DNA Data Bank of Japan),由日本国立遗传学研究所(National Institute of Geneics, NIG)开发并负责维护。

以上三个数据库共同组成了国际核酸序列数据库合作联盟(International Nucleotide Sequence Database Collaboration,INSDC)。即这个数据库的信息可以相互交换,同步更新,共享。INSDC:International Nucleotide Sequence Database Collaboration

(三)、二级核酸数据库

二级核酸数据库包含的内容很多,经常会用到的几个数据库有:NCBI下属的RefSeq数据库,dbEST数据库以及Gene数据库。

RefSeq数据库:参考序列数据库,是通过自动及人工精选出的非冗余数据库,包括基因组序列、转录序列和蛋白质序列。

dbEST数据库:表达序列标签数据库,包含来源于不同物种的表达序列标签(EST)

Gene数据库:为用户提供基因序列注释和检索服务,收录了来自5300多个物种的430万条基因记录

ncRNAdb:非编码RNA数据库,提供非编码RNA的序列和功能信息。包含来源于99种细菌,古细菌和真核生物的3万多条序列。

ncRNA链接: http://biobases.ibch.poznan.pl/ncRNA/

miRBase:主要存放已发表的microRNA序列和注释。可以分析microRNA在基因组中的定位和挖掘miRNA序列间的关系。

miRBase链接: http://www.mirbase.org/

(四)一级蛋白质序列数据库

1、UniPort数据库,链接:UniProt

swissprot:人工注释,注释可信度高、冗余度小

TrEMBL:计算机注释,包含为蛋白质编码的核酸序列的所有翻译产物

PIR:支持基因组学、蛋白质组学和系统生物学研究的综合公共生物信息学资源

UniParc:收录所有UniPort数据库子库中的蛋白质序列,量大,粗糙

UniRef:归纳UniPort几个主要数据库并将重复序列去除后的数据库

UniProtKB:有详细注释并与其他数据库有链接的数据库

(五)一级蛋白质结构数据库

1、PDB:蛋白质结构数据库(PDB)是全世界唯一存储生物大分子3D结构的数据库。这些生物大分子除了蛋白质以外还包括核酸及两者的复合物。只有通过实验方法获得的3D结构才会被收入其中。链接:RCSB PDB: Homepage

(六)二级蛋白质数据库

1、Pfam数据库:Pfam数据库是一个蛋白质结构域家族的集合,包括了一万六千多个蛋白质家族

2、CATH:结构分类数据库CATH,根据结构域的空间特征可以对结构域进行分类。数据库中四种结构分类层次分别是:蛋白质种类(class,C)、蛋白质二级结构的构架(architecture,A)、蛋白质的拓扑结构(topology,T)、蛋白质同源超家族(homologous superfamily,H)

3、SCOP2:结构分类数据库,该数据库详细描述了已知结构的蛋白质在结构、进化事件与功能类型三个方面的关系。SCOP2把SCOP中仅基于蛋白质结构的树状等级分类系统发展成为单向非循环网状分类系统

(七)专项数据库

1、KEGG:京都基因与基因组百科全书(KEGG),是关于基因、蛋白质、生化反应及通路的综合生物信息数据库,由多个子库构成

2、OMIM:人类孟德尔遗传在线(OMIM),是一个有关人类遗传病的数据库,它将遗传病分类并链接到相关人类基因组中的数据库

标签:信息学,DNA,数据库,分类,核酸,序列,链接,蛋白质
From: https://blog.csdn.net/qq_18296979/article/details/137285697

相关文章

  • 查询SQL server数据库在后台执行过的语句
    查询SQLserver数据库在后台执行过的语句SELECTTOP30000total_worker_time/1000AS[总消耗CPU时间(ms)],execution_count[运行次数],qs.total_worker_time/qs.execution_count/1000AS[平均消耗CPU时间(ms)],last_execution_timeAS[最后一次执......
  • 如何查看KingbaseES数据库占用操作系统内存情况
    当遇到数据库内存告警,并且操作系统内存使用不足,需要分析内存占用的方法。KingbaseES数据库使用操作系统缓存机制,大量的内存很可能被BUFFER/CACHE占用了。从free命令可以看到总共有2.5G多内存,使用了291MB,free剩下1.7GB多,BUFF/CACHE占了474MB。available有1.3GB多,当前这台数据库服......
  • KingbaseES数据库权限简写说明
    前言为了方便,我们测试环境经常使用system用户执行测试,它拥有最高权限。角色基本上是用户和组的概念。你可以以角色身份登录,并且一个角色可以属于另一个角色。每个角色都有一个类似的属性,指示你是否可以作为该角色登录,以及该角色是否从所属角色继承权限。你可以使用命令将角色添......
  • KingbaseES 数据库创建索引慢的可能原因
    1.表大小如果表太大,数据很多,索引创建的时候,会导致创建索引的时间很慢。如果表很大,可以考虑重新设计表结构或拆分表。还可以考虑使用分区表,使子分区的数据减少,创建分区表也可以使索引变小,增加索引创建速度,有助于查询效率。2.索引类型不同类型的索引建立的速度可能会有所不同,因......
  • KingbaseES 数据库IO优化方向总结
    前言数据库中的IO性能是优化中的重中之重,根据木桶原理,解决了IO这个最容易引起业务堵塞的问题,就能解决绝大部分性能问题。下面从几个方面总结一下I/O优化问题。第一,使用相对速度快的高性能存储设备。一般会考虑使用固态硬盘(SSD)或RAID阵列以获得更快的读写速度。高性能低......
  • Python访问mysql与sqlite3数据库
    在Python中,数据库访问是一个常见的需求,无论是在Web开发还是数据分析中都非常重要。Python提供了多种数据库访问库,使得与不同类型的数据库进行交互变得简单。在这篇博客中,我们将介绍如何使用Python进行数据库访问操作,并提供一些代码示例。Python数据库访问概述Python中的数据......
  • 03 MySQL数据库的基本操作-DDL
    DDL(DataDefinitionLanguage),数据定义语言,该语言部分包括以下内容对数据库的常用操作对表结构的常用操作修改表结构可以在命令行里面进行如下的操作;也可以在Navicat图形化工具中操作创建数据库createdatabase数据库名[库选项]例如:createdatabase数据库......
  • 使用BGE进行意图分类的示例代码
     importtorchfromtorch.utils.dataimportDataLoader,RandomSampler,TensorDatasetfromtransformersimportBertTokenizer,BertForSequenceClassification,AdamWbge_model_name="BAAI/bge-large-zh-v1.5"bert_model_name='bert-base-uncas......
  • SpringBoot集成Flink-CDC,实现对数据库数据的监听
    一、什么是CDC?  CDC是 ChangeDataCapture(变更数据获取) 的简称。核心思想是,监测并捕获数据库的变动(包括数据或数据表的插入、更新以及删除等),将这些变更按发生的顺序完整记录下来,写入到消息中间件中以供其他服务进行订阅及消费。二、Flink-CDC是什么?CDCConnector......
  • idea从零到精通07之idea数据库管理,作为移动开发程序员
    作者简介引言导航热门专栏推荐视频讲解概述一、打开Database管理界面二、配置数据库连接三、在图形化界面操作四、在控制台查询五、在控制台执行操作六、数据导出方法1,直接在结果控制台导出方法2,在Database管理区中导出七、数据结果的多种展示......