首页 > 系统相关 >Linux下快速比较两个目录的不同

Linux下快速比较两个目录的不同

时间:2022-08-27 12:05:10浏览次数:94  
标签:tmp 快速 find Linux diff root 目录 png

Linux下快速比较两个目录的不同

玩linux编程,文件对比还是经常用的;

[root@node1 ~]# tree directory1 directory2
directory1
├── 1.png
├── 2.png
└── 3.png
directory2
├── 2.png
├── 3.png
└── 4.png

1.命令行输出的结果

方法一:使用diff

diff -r directory1 directory2

但是diff会对每个文件中的每一行都做比较,所以文件较多或者文件较大的时候会非常慢。请谨慎使用。

方法二:使用diff结合tree

diff <(tree -Ci --noreport /mnt/f/自然马) <(tree -Ci --noreport /mnt/i/自然马)
< /mnt/f/自然马
---
> /mnt/i/自然马
87a88
> xyz.avi
488d488
< rsync.txt
534d533
< 542D0.mp4

说明:

  1. tree的-C选项是输出颜色,如果只是看一下目录的不同,可以使用该选项,但在结合其他命令使用的时候建议不要使用该选项,因为颜色也会转换为对应的编码而输出;
  2. -i是不缩进,建议不要省略-i,否则diff的结果很难看,也不好继续后续的文件操作;
  3. --noreport是不输出报告结果,建议不要省略该选项。
  4. 该方法效率很高。

方法三:find结合diff

find directory1 -printf "%Pn" | sort > file1
find directory2 -printf "%Pn" | sort | diff file1 -
2d1
< 1.png
4a4
> 4.png

 

说明:

  1. <代表的行是directory1中有而directory2没有的文件,>则相反,是directory2中有而directory1中没有。
  2. 不要省略-printf "%Pn",此处的%P表示find的结果中去掉前缀路径,详细内容man find。例如,find /root/ -printf "%Pn"的结果中将显示/root/a/xyz.txt中去掉/root/后的结果:a/xyz.txt。
  3. 效率很高,输出也简洁。

如果不想使用-printf,那么先进入各目录再find也行。

[root@node1 ~]# (cd /root/a;find . | sort >/tmp/file1)       
[root@node1 ~]# (cd /root/b;find . | sort | diff /tmp/file1 -)
2d1
< ./1.png
4a4
> ./4.png

上面将命令放进括号中执行是为了在子shell中切换目录,不用影响当前所在目录。

方法四:使用rsync

rsync -rvn --delete directory1/ directory2 | sed -n '2,/^$/{/^$/!p}'
deleting a/xyz.avi
rsync.txt
新建文件夹/542D0.mp4

其中deleting所在的行就是directory2中多出的文件。其他的都是directory中多出的文件。

如果想区分出不同的是目录还是文件。可以加上"-i"选项。

rsync -rvn -i --delete directory1/ directory2 | sed -n '2,/^$/{/^$/!p}'
*deleting   a/xyz.avi
>f+++++++++ rsync.txt
>f+++++++++ 新建文件夹/542D0.mp4

其中>f+++++++++中的f代表的是文件,d代表的目录。

上面的rsync比较目录有几点要说明:

  1. 一定不能缺少-n选项,它表示dry run,也就是试着进行rsync同步,但不会真的同步。
  2. 第一个目录(directory1/)后一定不能缺少斜线,否则表示将directory1整个目录同步到directory2目录下。
  3. 其它选项,如"-r -v --delete"也都不能缺少,它们的意义想必都知道。
  4. sed的作用是过滤掉和文件不相关的内容。
  5. 以上rsync假定了比较的两个目录中只有普通文件和目录,没有软链接、块设备等特殊文件。如果有,请考虑加上对应的选项或者使用-a替代-r,否则结果中将出现skipping non-regular file的提示。但请注意,如果有软链接,且加了对应选项(-l或-a或其他相关选项),则可能会出现fileA-->fileB的输出。
  6. 效率很高,因为rsync的原因,筛选的可定制性也非常强。

2.图形化的比较结果

方法一:使用vimdiff

vimdiff <(cd directory1; find . | sort) <(cd directory2; find . | sort)
# 或者
vimdiff <(find directory1 -printf "%Pn"| sort) <(find directory2 -printf "%Pn"| sort)

方法二:使用meld

meld是python写的一个图形化文件/目录比较工具,所以必须先安装图形界面或设置好图形界面接受协议。它的功能非常丰富,和win下的beyond compare有异曲同工之妙。

meld具体的使用方式就不介绍了。

3.将两目录中不同的文件筛选出来

个人建议使用命令行输出的结果中的方法方法三和方法四,因为它们都能很好地保留目录前缀。

以方法三为例:

find directory1 -printf "%Pn" | sort > file1
find directory2 -printf "%Pn" | sort | diff file1 -

以下是实验所需目录结构:

[root@node1 ~]# tree /root/a;tree /root/b 
/root/a
├── 1.png
├── 2.png
└── 3.png

0 directories, 3 files
/root/b
├── 2.png
├── 3.png
├── 4.png
└── xen
    └── scripts
        └── block-drbd

首先比较这两个目录得到文件列表的差异。

find /root/a -printf "%Pn" | sort > /tmp/file1
find /root/b -printf "%Pn" | sort | diff /tmp/file1 - >diff.txt

然后从diff.txt中过滤出/root/a中多出的文件和/root/b中多出的文件。

# /root/a中多出的文件
awk '/</{printf("%s%sn","/tmp/etc/",$2)}' diff.txt
/tmp/etc/1.png

# /root/b中多出的文件
awk '/>/{printf("%s%sn","/tmp/etc/",$2)}' diff.txt
/tmp/etc/4.png
/tmp/etc/xen
/tmp/etc/xen/scripts
/tmp/etc/xen/scripts/block-drbd

需要注意的是,如果多了某个目录,则这个目录和其内所有文件都会列出来。如果要将多出的文件复制到其他地方,应当要注意这一点。

如果只想要比较出/root/a和/root/b下的文件和目录的不同,不再递归到子目录中比较。那么可以在find上继续加工一番:

find /root/a -maxdepth 1 -printf "%Pn" | sort > /tmp/file1
find /root/b -maxdepth 1 -printf "%Pn" | sort | diff /tmp/file1 - >diff.txt
# /root/a中多出的文件
awk '/</{printf("%s%sn","/tmp/etc/",$2)}' diff.txt
/tmp/etc/1.png

# /root/b中多出的文件
awk '/>/{printf("%s%sn","/tmp/etc/",$2)}' diff.txt
/tmp/etc/4.png
/tmp/etc/xen

这样一来,/root/b中多出的文件就是4.png和xen,xen目录中的文件不再列出。

标签:tmp,快速,find,Linux,diff,root,目录,png
From: https://www.cnblogs.com/sll120/p/16630275.html

相关文章

  • 在 Arch Linux 上安装 snap
    在ArchLinux上安装snap在ArchLinux上,snap可以从Arch用户存储库(AUR)。的手动构建过程AUR包安装方法,您需要先决条件,然后才能安装任何AUR包。然后,......
  • linux绑核方法
    1isolcpus:isolcpus功能由来,可以追溯到v2.6.11(2005年版本)就已经存在了isolcpus。根据kernel-parameters.txt上的解释,”isolcpus功能用于在SMP均衡调度算法中将一个或多个......
  • Linux 服务器巡检脚本
    #!/bin/bashcat<<EOF+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++2022年某公司系统运行情况检查+++++++++++++++++++++++++++++++++......
  • Linux学习笔记1——Linux简介、版本、安装
    Linux学习笔记1——Linux简介、版本、安装1、Linux简介:一种开源的,免费的操作系统,安装在计算机硬件上,用来管理计算机的硬件和软件资源的系统软件。Linux注重安全性,稳定性......
  • Linux 高级IO
    记录锁https://www.cnblogs.com/zhh567/p/16380823.htmlIO多路复用https://www.cnblogs.com/zhh567/p/16629782.htmlreadvwritev用于在一次函数调用中读写多个非连续......
  • KingbaseES例程之快速删除表数据
    概述快速删除表中的数据delete语句删除数据表中的数据被删除了,但是这个数据在硬盘上的真实存储空间不会被释放。这种删除缺点是:删除效率比较低。这种删除优点是:支持......
  • Linux操作系统(十一):磁盘配额与高级文件系统管理
    磁盘配额的应用与实践软件磁盘阵列RAID逻辑卷管理器LVMbtrfs文件系统管理与应用 一、关于本文内容的导读这部分不涉及具体内容的解析,只是作为浏览和查找相关知识点......
  • 10个快速入门Query函数使用的Pandas的查询示例
    转载:https://mp.weixin.qq.com/s/TJStQDtUfOOXtb__cpivDgpandas.的query函数为我们提供了一种编写查询过滤条件更简单的方法,特别是在的查询条件很多的时候,在本文中整理了1......
  • 快速理解 自适应和响应式 区别?
    自适应和响应式区别?1.自适应需要开发多套界面,响应式只需要一套2. 自适应:同一个页面用不同的设备去访问的时候,页面布局基本上是一致的,就是尺寸略有不同  响应式:同一......
  • linux安装chrome 亲测可用!!
     一、在终端输入以下命令:sudowgethttp://www.linuxidc.com/files/repo/google-chrome.list-P/etc/apt/sources.list.d/将下载源加入到系统的源列表/etc/apt/......