15-有参转录组实战1-批量质控-fastp

时间：2023-11-25 21:46:22浏览次数：57

#本教程部分参考B站15天入门生物信息教程，在开启以下教程前，请务必看看我前面两个教程，Linux系统上安装R语言（https://www.bilibili.com/read/cv24718269）和下载好转录组（https://www.bilibili.com/read/cv24719254）。

#1，我们对上次下载的转录组进行实战分析，首先进行质量控制，使用fastp软件。

conda list#查看目前已经安装的包

conda search fastp#查看版本

conda install fastp=0.23.2#建议装个偏旧的版本

fastp-h#检查是否安装成功，有东西出来就行

#2，对文件重命名，回看NCBI，SRR22954651- SRR22954653是野生型，另外3个就是过表达了。

#3，生成sample.txt文件，每行后面有个空格，最后一行是空行：

#4，生成批量命令脚本

awk'{print "fastp -i "$1".fastq.gz -I "$2".fastq.gz -o "$1".clean.fq.gz -O "$2".clean.fq.gz -h "$3".html &"}'sample.txt>command_fastp.sh

#5，看看command_fastp.sh文件

#6，运行脚本

sh command_fastp.sh

#7，或者将步骤3-6改为使用for循环：

for i in {1..3};do fastp -i WT${i}_1.fastq.gz -I WT${i}_2.fastq.gz -o WT${i}_1.clean.fq.gz -O WT${i}_2.clean.fq.gz -h WT${i}.html;done;

for i in {1..3};do fastp -i OE${i}_1.fastq.gz -I OE${i}_2.fastq.gz -o OE${i}_1.clean.fq.gz -O OE${i}_2.clean.fq.gz -h OE${i}.html;done;

#8，等到html文件出来就行，这里大概用了15min，查看结果，有clean data，还有HTML的报告，报告解读主要看Q30>85%，它这个上传文件就是质控过的，所以质控前后的数据基本一致。目前生物公司测序后的数据基本也是像这样质控完了，才会给客户，而且质量基本都不错。但是以防万一，还是要自己质控一遍的。

#eva

#加个尾图

标签：fq,15,fastq,fastp,gz,clean,质控
From： https://www.cnblogs.com/liangjinghui/p/17856152.html

Educational Codeforces Round 158 补题(A~D)
A.思路找出最大耗油的路程即可ac代码#include<bits/stdc++.h>usingnamespacestd;usingi64=longlong;consti64inf=8e18;typedefpair<int,int>pii;voidsolve(){intn,x;cin>>n>>x;std::vector<int>v(n);f......
83rd 2023/11/15 NOIP Day-2
早上回学校参加国标了，晚上继续停课训练思考了今天上午其他学校人打的模拟赛，T3是很有意思的网络流建图T1是一道贪心策略题，思路认真推之下应该能够想出老师讲了面对比赛应有的态度，是的，应该全力以赴面对这场难得的机会再补一下短板吧，DP、贪心和网络流建图（虽说不一定用得上），但万无......
Educational Codeforces Round 158 (Rated for Div. 2)
A.LineTrip题意是：有n个加油点，人要来回两趟，问你最少要多少油？usingnamespacestd;inta[100];voidsolve(){ intn,m; cin>>n>>m; for(inti=1;i<=n;i++)cin>>a[i]; intans=a[1]; for(inti=2;i<=n;i++){ ans=max(ans,a[i]-a[i-1]); } ans=max(ans,2*(m-......
Educational Codeforces Round 158 (Rated for Div. 2) A-C
A大致题意：有一条长度为x的直线公路，最开始你位于0号点并且此时你的油箱装满了油，公路有n个加油站，当你经过加油站的时候你可以在加油站加满油，每走一个单位需要花费1升油量，起始位置和终点没有加油站，请问你的油箱容量至少为多少升才可以够你跑一个来回。解题思路：我们的路径大致是......
[Codeforces] CF1506C Epic Transformation
EpicTransformation-洛谷算是今天的题目里边思维难度最高的一道了，但是代码真的简单的要死题意你有一个长度为 $n$ 的序列 $a$，你可以对其进行下列操作：选择 $i,j$ 满足 $*a_i\neqa_j*$ 然后删除 $*a_i,a_j*$ 两个数。求序列 a 经过若干次操作后最少......
Oracle DBA遇到的top150个问题
作为OracleDBA（数据库管理员），以下是更多常见的Oracle数据库管理中可能遇到的150个问题案例：数据库备份和恢复失败数据库性能下降数据库连接问题长时间运行的查询和死锁数据库服务器崩溃或宕机数据库空间不足数据库日志文件过大数据库表空间损坏数据库安全漏洞数据库版本升......
P1531 I Hate It
单点修改+区间查询IHateIt题目背景很多学校流行一种比较的习惯。老师们很喜欢询问，从某某到某某当中，分数最高的是多少。这让很多学生很反感。题目描述不管你喜不喜欢，现在需要你做的是，就是按照老师的要求，写一个程序，模拟老师的询问。当然，老师有时候需要更新某位同学的成绩。......
PGSOFT最新动向：iPhone 15销售低迷，华为逆袭势不可当
近日，PGSOFT传出的消息令行业震惊，根据市场数据显示，iPhone15的销量出现了明显的下滑趋势，这使得华为不仅在东山再起，而且势头更加汹汹。这一信息在手机市场掀起了不小的波澜，也引起了消费者和业内人士的广泛关注。据悉，PGSOFT作为一家在手机软件领域崭露头角的公司，一直以来都在不断推陈......
（15-418）Lecture 2 A Modern Multi-Core Processor
并行执行的方式本节内容围绕一个程序，针对如何改变处理器的结构来加速程序提出了多个idea示例程序：该程序通过泰勒展开式来估算sin(x)的值一个最简单的处理器，每个时钟周期只能执行一条指令，而利用ILP（指令级平行）的超标量处理器可同时执行两条指令（当指令间不存在依赖时），但示例程序......
【PADAUK】应广单片机一级代理 PFC151系列
Padauk是一家专业的单片机一级代理，我们提供全面的单片机解决方案，包括PFC151系列。PFC151系列是一款高性能的单片机，它具有低功耗、高速度、高可靠性等优点。该系列单片机适用于各种应用，如智能家居、智能安防、智能工业等。在智能家居领域，PFC151系列单片机可以用于控制家用电器、照明......

15-有参转录组实战1-批量质控-fastp

相关文章

赞助商

阅读排行