首页 > 其他分享 >R:microtable数据准备

R:microtable数据准备

时间:2024-05-07 16:46:54浏览次数:24  
标签:cal abund microtable 准备 dataset dirpath save 数据

rm(list = ls())
setwd("C:\\Users\\Administrator\\Desktop\\microtable") #设置工作目录
library(microeco)
library(magrittr)

feature_table <- read.table('feature_table_g.txt', header = TRUE, row.names = 1, sep = "\t") #特征表
sample_table <- read.table('sample_table_g.txt', header = TRUE, row.names = 1, sep = "\t") #样本表
tax_table <- read.table('tax_table_g.txt', header = TRUE, row.names = 1, sep = "\t", fill = TRUE) #分类表

dataset <- microtable$new(sample_table = sample_table,
                          otu_table = feature_table, 
                          tax_table = tax_table)

dataset$tidy_dataset() #整理和预处理数据集
#数据清洗:移除或填补缺失值、异常值等。
#数据标准化:确保数据符合一定的格式,比如统一的数据类型。
#数据整合:如果有多个表格,确保它们之间的链接正确无误。

dataset$sample_sums() %>% range #计算并查看样本总数的范围

dataset$rarefy_samples(sample.size = 1000000) #执行重采样,标准化样本中的测序深度

dataset$sample_sums() %>% range #计算并查看标准化后样本总数的范围

#dataset$save_table(dirpath = "basic_files", sep = ",") #将 microtable 对象中的所有基本数据保存到本地文件

dataset$cal_abund() #计算每个分类等级的分类群丰度
#class(dataset$taxa_abund)
#dataset$taxa_abund$Phylum[1:5, 1:5]

dataset$cal_alphadiv(PD = FALSE) #计算 alpha 多样性
dataset$save_alphadiv(dirpath = "alpha_diversity") #文件存储

dataset$cal_betadiv(unifrac = FALSE) #beta 多样性
dataset$save_betadiv(dirpath = "beta_diversity") #文件存储

 

标签:cal,abund,microtable,准备,dataset,dirpath,save,数据
From: https://www.cnblogs.com/wzbzk/p/18177712

相关文章

  • 加密技术在保护企业数据中的应用
    加密技术是企业数据保护的核心,对于维护信息安全至关重要。透明加密技术使文件加密后不改变用户对文件的使用习惯,内部文件打开自动解密,存储自动加密,一旦离开使用环境,加密文件将无法正常读取,从而保护文件内容。华企盾DSC数据安全防泄密系统在这方面提供了强大的支持,以下是加密技术在......
  • SQL实战(三)——数据表操作
    1.创建表/*创建一个用户表users:id:用户id,整数类型,自增长,作为主键。username:用户名,变长字符串,不允许为空。email:用户邮箱,变长字符串,不允许为空。birthdate:用户的生日,日期类型。is_active:用户是否已经激活,布尔类型,默认值为true。*/CREATETABLEusers(......
  • 数据结构
    前缀和结构特征:连续子数组的元素和技巧:len(前缀和)=len(list)+1前缀和可以作为list的v,也可做为list的index!----哈希表(问的是xxx的数目)presum=[0]+list(accumulate(nums))---得到前缀和数组accumulate函数可以累加nums的值哈希表使用......
  • 如何为数据库中新建用户B复制用户A的表和视图权限?
    故事背景:公司使用的是SQLServer数据库,经常会碰到一种情况,需要为新入职的员工赋予同组内其他同事的权限。  常用方法:1,为同一组申请创建统一的SecurityGroup(安全组),为创建的组分配相关表和视图的访问权限。不管员工入职还是离职,仅需将组内的成员进行相关的添加和删除即可......
  • 数据分析-Pandas模块
    pandas是以NumPy为基础进行设计的,因此pandas不仅能与其他大多数模块兼容,而且还能借力NumPy模块强大的计算能力,因此,在数据分析中pandas和NumPy这两个模块经常是一起使用的。为了数据分析的需要,pandas既不使用Python已有的内置数据结构,也不使用其他库的数据结构,而是专门设计了两种......
  • toapi:抓取任意网页内容并提供 HTTP API获取数据
    Github地址:https://github.com/elliotgao2/toapiPythonToapi是一个基于XPath和CSS选择器的WebAPI框架,它能够快速将网页内容转换为结构化的API。Toapi提供了简单易用的接口,使得开发者可以轻松地从网页中提取数据,并以API的形式呈现出来。同时,Toapi支持自定义规则和过......
  • 数据库管理工具-DBeaver安装
    DBeaver官网下载1.点击下载dbeaver程序2.双击安装,安装过程如下操作......
  • Canvas简历编辑器-我的剪贴板里究竟有什么数据
    Canvas图形编辑器-我的剪贴板里究竟有什么数据在这里我们先来聊聊我们究竟应该如何操作剪贴板,也就是我们在浏览器的复制粘贴事件,并且在此基础上聊聊我们在Canvas图形编辑器中应该如何控制焦点以及如何实现复制粘贴行为。在线编辑:https://windrunnermax.github.io/CanvasEdito......
  • pytorch训练简单加减验证码(一):数据加载器实现
    1、torch.utils.data.Datasettorch.utils.data.Dataset是代表自定义数据集方法的类,用户可以通过继承该类来自定义自己的数据集类,在继承时要求用户重载__len__()和__getitem__()这两个魔法方法。len():返回的是数据集的大小。我们构建的数据集是一个对象,而数据集不像序列类型(列表......
  • openGauss 导入数据
    导入数据openGauss数据库提供了灵活的数据入库方式:INSERT、COPY以及gsql元命令\copy。各方式具有不同的特点,具体请参见表1。表1导入方式特点说明方式特点INSERT通过INSERT语句插入一行或多行数据,及从指定表插入数据。COPY通过COPYFROMSTDIN语句直接向openGa......