首页 > 其他分享 >FASTQ | md5 | 原始文件保存、传输、完整性检验

FASTQ | md5 | 原始文件保存、传输、完整性检验

时间:2022-09-07 16:56:22浏览次数:114  
标签:文件 FASTQ gz 传输 完整性 原始 fastq md5

 

像fastq这样的原始文件是肯定不能丢掉的,必须保存在硬盘里或者放到ftp服务器上,以便之后再度调取分析。

fastq保存时问题不大,但因为文件巨大,传输通常需要几小时-几天,非常容易在传输过程中损毁,这时候我们就需要一种方法来检验我们下载的fastq(任何其他原始文件)是否完整。

MD5信息摘要算法(英语:MD5 Message-Digest Algorithm),一种被广泛使用的密码散列函数,可以产生出一个128位(16字节)的散列值(hash value),用于确保信息传输完整一致。

安装:Macos 安装md5sum、sha1sum、md5deep、sha1deep

brew install md5sha1sum

 

建议:任何原始文件都必须构建md5原始验证码,然后存档。

md5sum *.gz > md5.txt

检测:

md5sum -c md5.txt

 


 

 

如果下载的fastq没有md5,则有两种办法:

一、用gzip检验gz的文件完整性

参考:使用gunzip命令的t参数检测fastq的gz文件完整度

gunzip -t SRR11652583_2.fastq.gz

 

二、检查配对端FASTQ数据完整性

直接计数行数即可,配对就基本没问题。

wc -l `gzcat *.gz`
wc -l `find -name *.gz`

  

OSX不能直接用zcat,Linux则可以。  

对于这种大数据,最好使用C写的工具,哪些别人用perl和python写的就不要用了,速度可以气死你,Linux上的基础命令基本能胜任大部分工作。

 

标签:文件,FASTQ,gz,传输,完整性,原始,fastq,md5
From: https://www.cnblogs.com/leezx/p/16666414.html

相关文章

  • BUUCTF [BJDCTF2020]Easy MD5 详解
    1.题目搞了好久,这道题,就一个简简单单的输入框。2、利用md5($password,true)实现SQL注入打开题目,看上去像sql注入,也有可能是命令执行,或者SSRF,但是注入半天也没什么反应......
  • Python批量校验两个文件夹里面的文件MD5
    importbase64importhashlibimportosg_origin_path="【目录】"g_target_path="【目录】"defget_file_md5(filepath):f=open(filepath,'rb')md5......
  • 不用工具,如何快速计算文件的MD5?
    不用工具,如何快速计算文件的MD5?网络安全现在是信息化系统中的必备要素。大家在各种软件下载站上下载的文件,到底有没有被植入木马,是否安全,你心里有底吗?植入木马的一种常用......
  • Java实现MD5加密
    Java实现MD5加密1、maven引入jar包<dependency><groupId>commons-codec</groupId><artifactId>commons-codec</artifactId><version>1.14......
  • js md5 和java md5后的值不一样
         开发发现js对字符串md5和java对字符串md5计算的结果居然不一样,后来找了一个匹配的这里记录一下注:加密的对象中不能有空格,有空格md5后的结果就不一致,都是眼......
  • 利用md5命名
    用md5importhashlib_a=hashlib.md5(_model_file.encode('utf-8')).hexdigest()resource_name=f'tfmodel_{_a}.tar.gz'不能缩短importbase64_a=base64.s......
  • 软件系统中如何保证数据的完整性
    信息系统中产生数据,修改数据,删除数据,查询数据,都要保证数据的完整性,一致性1.完整性数据的类型:字符串,数值,货币,时间,布尔等数据的长度:数据的存储空间数据的规则:身份证,手机......
  • python 中统计fastq文件中 GC含量
     001、root@PC1:/home/test#lsa.fastqtest.pyroot@PC1:/home/test#cata.fastq##测试fastq文件@DJB775P1:248:D0MDGACXX:7:1202:12......
  • python 中实现将fastq文件转换为fasta文件
     001、root@PC1:/home/test#lsa.fastqtest.pyroot@PC1:/home/test#cata.fastq##测试fastq文件@DJB775P1:248:D0MDGACX......
  • python 中 实现统计fastq碱基序列的长度
     001、root@PC1:/home/test#lsa.fastqtest.pyroot@PC1:/home/test#cata.fastq##测试fastq文件@DJB775P1:248:D0MDGACXX:7:......