首页 > 系统相关 >12-Linux系统上安装aspera并用其批量高速下载转录组数据

12-Linux系统上安装aspera并用其批量高速下载转录组数据

时间:2023-11-25 21:37:35浏览次数:35  
标签:转录 文件 12 ascp sh aspera 高速下载 id

 

#使用aspera能够帮助我们批量高速下载转录组等数据,现在使用conda进行安装

conda install -c hcc aspera-cli -y

#检查是否安装成功,有东西出来就行

ascp -h

#另外看看asperaweb_id_dsa.openssh文件是不是在miniconda3/etc文件夹中,务必确认该文件的位置。

#我们看看NCBI上面有什么样的转录组,在官网上打好毛果杨拉丁名,选择SRA搜索,我选了这个,点进去看看

 

#看到工程号,复制这个号,顺便看看别的一些信息,了解该转录组,看到这个是过表达了个PtrVCS2,在PUBMED搜下,文章发表在IJMS,DOI: 10.3390/ijms24054458。

 

#复制工程号后,在ENA网站(https://www.ebi.ac.uk/ena/browser/home),搜索

 

#往下拉,找到TSV,下载文件

 

#看见文件里面有每个SRR的下载地址,如果是单个文件下载的话,命令如下,下载到当前文件夹,速度居然有280Mb/s,学校服务器真强:

ascp -vQT -l 500m -P33001 -k 1 -i \

~/miniconda3/etc/asperaweb_id_dsa.openssh \

[email protected]:/vol1/fastq/SRR229/051/SRR22954651/SRR22954651_1.fastq.gz./

 

 

#但是不可以这么笨笨哦,要学会批量下载。将刚刚下载的TSV文件整理成以下的样子,每行后面留一个空格,并且最后留一行空行出来,命名为id.txt:

 

#将id.txt传到linux系统中,批量生成命令行,输出文件command_ascp.sh:

awk '{print "ascp -vQT -l 500m -P33001-k 1 -i ~/miniconda3/etc/asperaweb_id_dsa.openssh era-fasp@"$1" ./ &"}'id.txt > command_ascp.sh

#查看一下这个command_ascp.sh文件:

 

#在工作文件夹中,运行这个脚本,并挂载后台,记得两次enter:

nohup sh command_ascp.sh &

 

 

#最后看看结果,3个实验组,3个对照组,双端测序,共12个文件

 

#一定要自己看懂理解代码,不可以照抄,aspera的教程有很多,有问题就百度吧。

 

#妖精的旋律~

标签:转录,文件,12,ascp,sh,aspera,高速下载,id
From: https://www.cnblogs.com/liangjinghui/p/17856128.html

相关文章

  • day12 购物车系统实战
    注册函数:defregisiter():withopen(r"F:\pylearn\day12\购物车系统\账号密码.txt","r",encoding="utf8")asfr:user_dict=dict()data=fr.read()foriinrange(len(data.split())):user_dict[data.......
  • 1125傍晚
    ......
  • Sumsets(UVA10125)整数集合
    备课的时候发现了这道题,对于初识哈希来说并不算一道很简单的题。在查阅林厚从老师的示例代码与往届OI选手的博客后,大致理解了本题的思路。相关标签:Hash跳转至本题Description给定一个整数集合S,求一个最大的d,满足a+b+c=d,其中a,b,c,d∈SInput多组数据,每组数据包括:第一行一......
  • 20231125橡胶
    目前在等待日线有没有一波C3的上涨波段。  具体到下周走势,也会比较跌宕起伏: ......
  • 2023.11.25-2023.12.31 模拟赛记录
    苟。11.25多校dream给定N,求\(\sum_{i\in\left[1,2^N\right]}\log_2\left(\prod_{j\in[1,i]}\text{lowbit}(j)\right)\)。(N<=1e18)找个规律发现\(\log_2\left(\prod_{j\in[1,i]}\text{lowbit}(j)\right)\)就是\(i-\text{popcount}(i)\)。不难移值域,算贡献。ca......
  • 2023年12月整理书单列表
    布迪厄&莫里斯·哈布瓦赫               ......
  • 20231124
    又是容斥的一天呢。容斥做傻了,每次推容斥系数都能推错。放学的时候@Super_Cube给我说了明天gm打算从「CDQ解决二维偏序问题」讲起,瞬间就不想去听gm上课了。但是@Super_Cube给我说「偶尔听gm发癫还是能放松一下的。」我说『不行,浪费我时间。』「也就两个小时而已,况且“......
  • 20211128《信息安全系统设计与实现》第十三章学习笔记
    一、任务内容自学教材第13章,提交学习笔记(10分)1.知识点归纳以及自己最有收获的内容,选择至少2个知识点利用chatgpt等工具进行苏格拉底挑战,并提交过程截图,提示过程参考下面内容(4分)“我在学***X知识点,请你以苏格拉底的方式对我进行提问,一次一个问题”核心是要求GPT:“请你以苏格......
  • 4599元 铭凡推出NAG6迷你主机:12代i9+RX 6600M
    铭凡推出了新款迷你主机NAG6,首发价4599元。据了解,新款迷你主机的处理器采用的是i9-12900H,14核心20线程、24MBL3缓存,最高睿频达5.0GHz。不仅如此,新款迷你主机内置RX6600M独显,RDNA2架构,1792个流处理器,频率2177-2416MHz,显存8GBGDDR6。此外,铭凡NAG6内存支持DDR4双通道,存储支持22......
  • 20231124
    /*time:O(unknown)space:O(n*n)knowledge:树的直径step:dfs*2*/#include<bits/stdc++.h>usingnamespacestd;intn;vector<int>t[105];boolvis[105];ints,len;voiddfs(intx,intd){vis[x]=true;if(len<d){s=x;len......