首页 > 系统相关 >Linux下比较两个目录的不同

Linux下比较两个目录的不同

时间:2024-09-08 11:14:07浏览次数:9  
标签:文件 find 目录 Linux diff root 比较 png

曾多次想要在Linux下比较目录a和目录b中文件列表的差别,然后对目录a比目录b中多出的文件、少掉的文件分别做处理。但是,在网上搜索了多次也都没找到能直接处理好的工具。

所以想了不少方法,自我感觉都不错,而且网上似乎没有这方面的文章,所以分享出来给大家。如果各位有更好的工具或者方法,盼请留下说明(本文第2部分:图形化的比较结果搜集自网上,我也没有在图形化界面下操作的需要,所以没有多做介绍)

以下是本文有些地方涉及到的目录结构。

[root@node1 ~]# tree directory1 directory2
directory1
├── 1.png
├── 2.png
└── 3.png
directory2
├── 2.png
├── 3.png
└── 4.png

1.命令行输出的结果

方法一:使用diff

diff -r directory1 directory2

但是diff会对每个文件中的每一行都做比较,所以文件较多或者文件较大的时候会非常慢。请谨慎使用。

方法二:使用diff结合tree

diff <(tree -Ci --noreport /mnt/f/自然马) <(tree -Ci --noreport /mnt/i/自然马)
< /mnt/f/自然马
---
> /mnt/i/自然马
87a88
> xyz.avi
488d488
< rsync.txt
534d533
< 542D0.mp4

说明:

  1. tree的-C选项是输出颜色,如果只是看一下目录的不同,可以使用该选项,但在结合其他命令使用的时候建议不要使用该选项,因为颜色也会转换为对应的编码而输出;
  2. -i是不缩进,建议不要省略-i,否则diff的结果很难看,也不好继续后续的文件操作;
  3. --noreport是不输出报告结果,建议不要省略该选项。
  4. 该方法效率很高。

方法三:find结合diff

find directory1 -printf "%P\n" | sort > file1
find directory2 -printf "%P\n" | sort | diff file1 -
2d1
< 1.png
4a4
> 4.png

说明:

  1. <代表的行是directory1中有而directory2没有的文件,>则相反,是directory2中有而directory1中没有。
  2. 不要省略-printf "%P\n",此处的%P表示find的结果中去掉前缀路径,详细内容man find。例如,find /root/ -printf "%P\n"的结果中将显示/root/a/xyz.txt中去掉/root/后的结果:a/xyz.txt。
  3. 效率很高,输出也简洁。

如果不想使用-printf,那么先进入各目录再find也行。

[root@node1 ~]# (cd /root/a;find . | sort >/tmp/file1)       
[root@node1 ~]# (cd /root/b;find . | sort | diff /tmp/file1 -)
2d1
< ./1.png
4a4
> ./4.png

上面将命令放进括号中执行是为了在子shell中切换目录,不用影响当前所在目录。

方法四:使用rsync

rsync -rvn --delete directory1/ directory2 | sed -n '2,/^$/{/^$/!p}'
deleting a/xyz.avi
rsync.txt
新建文件夹/542D0.mp4

其中deleting所在的行就是directory2中多出的文件。其他的都是directory中多出的文件。

如果想区分出不同的是目录还是文件。可以加上"-i"选项。

rsync -rvn -i --delete directory1/ directory2 | sed -n '2,/^$/{/^$/!p}'
*deleting   a/xyz.avi
>f+++++++++ rsync.txt
>f+++++++++ 新建文件夹/542D0.mp4

其中>f+++++++++中的f代表的是文件,d代表的目录。

上面的rsync比较目录有几点要说明:

  1. 一定不能缺少-n选项,它表示dry run,也就是试着进行rsync同步,但不会真的同步。
  2. 第一个目录(directory1/)后一定不能缺少斜线,否则表示将directory1整个目录同步到directory2目录下。
  3. 其它选项,如"-r -v --delete"也都不能缺少,它们的意义想必都知道。
  4. sed的作用是过滤掉和文件不相关的内容。
  5. 以上rsync假定了比较的两个目录中只有普通文件和目录,没有软链接、块设备等特殊文件。如果有,请考虑加上对应的选项或者使用-a替代-r,否则结果中将出现skipping non-regular file的提示。但请注意,如果有软链接,且加了对应选项(-l或-a或其他相关选项),则可能会出现fileA-->fileB的输出。
  6. 效率很高,因为rsync的原因,筛选的可定制性也非常强。

方法五:把文件列表装进数组进行比较

把目录1内的所有文件放进数组1,目录2内的所有文件放进数组2,比较数组1和数组2即可。这种方式也可以考虑使用脚本语言快速实现。

当然,也可以放进关联数组或hash结构。下面是shell脚本的实现方式:


#!/usr/bin/env bash

declare -A arr1 arr2

old_ifs="$IFS"
IFS=$'\n'
for i in $(ls -1A "$1");do arr1["$i"]=1; done
for i in $(ls -1A "$2");do arr2["$i"]=1; done
IFS="$old_ifs"

echo "--- files in in '$1' and not in '$2' ---"
for key in "${!arr1[@]}";do 
  [ "${arr2[$key]}" ] || echo "$key"
done

echo "--- files in in '$2' and not in '$1' ---"
for key in "${!arr2[@]}";do 
  [ "${arr1[$key]}" ] || echo "$key"
done

执行:

$ bash a.sh directory1 directory2

2.图形化的比较结果

方法一:使用vimdiff

vimdiff <(cd directory1; find . | sort) <(cd directory2; find . | sort)
# 或者
vimdiff <(find directory1 -printf "%P\n"| sort) <(find directory2 -printf "%P\n"| sort)

方法二:使用meld

meld是python写的一个图形化文件/目录比较工具,所以必须先安装图形界面或设置好图形界面接受协议。它的功能非常丰富,和win下的beyond compare有异曲同工之妙。

meld具体的使用方式就不介绍了。

3.将两目录中不同的文件筛选出来

以方法三为例:

find directory1 -printf "%P\n" | sort > file1
find directory2 -printf "%P\n" | sort | diff file1 -

以下是实验所需目录结构:

[root@node1 ~]# tree /root/a;tree /root/b 
/root/a
├── 1.png
├── 2.png
└── 3.png

0 directories, 3 files
/root/b
├── 2.png
├── 3.png
├── 4.png
└── xen
    └── scripts
        └── block-drbd

首先比较这两个目录得到文件列表的差异。

find /root/a -printf "%P\n" | sort > /tmp/file1
find /root/b -printf "%P\n" | sort | diff /tmp/file1 - >diff.txt

然后从diff.txt中过滤出/root/a中多出的文件和/root/b中多出的文件。

# /root/a中多出的文件
awk '/</{printf("%s%s\n","/tmp/etc/",$2)}' diff.txt
/tmp/etc/1.png

# /root/b中多出的文件
awk '/>/{printf("%s%s\n","/tmp/etc/",$2)}' diff.txt
/tmp/etc/4.png
/tmp/etc/xen
/tmp/etc/xen/scripts
/tmp/etc/xen/scripts/block-drbd

需要注意的是,如果多了某个目录,则这个目录和其内所有文件都会列出来。如果要将多出的文件复制到其他地方,应当要注意这一点。

如果只想要比较出/root/a和/root/b下的文件和目录的不同,不再递归到子目录中比较。那么可以在find上继续加工一番:

find /root/a -maxdepth 1 -printf "%P\n" | sort > /tmp/file1
find /root/b -maxdepth 1 -printf "%P\n" | sort | diff /tmp/file1 - >diff.txt
# /root/a中多出的文件
awk '/</{printf("%s%s\n","/tmp/etc/",$2)}' diff.txt
/tmp/etc/1.png

# /root/b中多出的文件
awk '/>/{printf("%s%s\n","/tmp/etc/",$2)}' diff.txt
/tmp/etc/4.png
/tmp/etc/xen

这样一来,/root/b中多出的文件就是4.png和xen,xen目录中的文件不再列出。

 

转载请注明出处:https://www.cnblogs.com/f-ck-need-u/p/9071033.html

标签:文件,find,目录,Linux,diff,root,比较,png
From: https://www.cnblogs.com/gdjgs/p/18402692

相关文章

  • [Linux]文件挂载和卸载
    在Linux中,挂载和卸载文件系统过程是什么?在Linux中,挂载和卸载文件系统是系统管理中常见的操作,用于访问和管理存储设备上的数据。以下是挂载和卸载文件系统的基本过程:挂载文件系统过程:准备挂载点:在Linux系统中,挂载文件系统需要一个挂载点,这是一个空目录,充当存储设备和Linux文件......
  • 从零搭建一个网站-云服务器Linux版——2:安装服务器MySQL+报错
    使用需要的东西:     软件:Xshell。    硬件:一台云服务器,一个域名。        系统环境:Windows11专业版 23H2。        Linux版本:CentOS9前景提要:在上一章已进行了服务器购买,系统搭设,Xshell访问服务器,域名购买,域名解析,Nginx软件搭建运行,......
  • Linux 磁盘管理
    1.磁盘分类磁盘,硬盘!=内存HDD(hard)机械硬盘.SSD(solid)固态硬盘.磁盘接口:类似于水壶的壶嘴,决定了磁盘最大速度.⭐硬盘选项说明容量转速机械硬盘SATA备份服务器,性能要求不高场景,10krpm4tb8tb10tb根据需要选择(未来规划)机械硬盘SAS企业环......
  • 【Linux修行路】基于阻塞队列的生产消费者模型
    目录⛳️推荐一、生产消费者模型1.1生产消费者模型的解藕特性二、基于BlockingQueue的生产消费者模型2.1单生产单消费模型2.2伪唤醒、误唤醒造成的问题2.3基于任务的多生产多消费模型⛳️推荐前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一......
  • Linux高效进程控制的实战技巧
    Linux高效进程控制的实战技巧Linux是一种开源的Unix-like操作系统内核,由林纳斯·托瓦兹(LinusTorvalds)于1991年首次发布。Linux以其稳定性、安全性和灵活性而著称,广泛应用于服务器、桌面、嵌入式系统等多个领域。在Linux系统编程中,进程管理是核心部分之一,它涉及到如何创建......
  • 全栈性能优化秘籍--Linux 系统性能调优全攻略:多维度优化技巧大揭秘
           ......
  • 在Linux中,可以使用以下命令来获取脚本所在的目录:
    在Linux中,有几种方式可以获取当前正在执行的脚本所在的路径。这些方法依赖于你正在使用的shell(比如bash)或者脚本语言(比如Python,Perl等)。以下是一些常见的方法,特别是在bash脚本中获取脚本路径:###1.使用`$0`和`dirname`命令在bash脚本中,`$0`变量包含了脚本的名称或者路......
  • 斯坦福大学2014机器学习教程中文笔记目录
    http://www.ai-start.com/ml2014/第一周一、引言(Introduction)1.1欢迎1.2机器学习是什么?1.3监督学习1.4无监督学习二、单变量线性回归(LinearRegressionwithOneVariable)2.1模型表示2.2代价函数2.3代价函数的直观理解I2.4代价函数的直观理解II2.5梯......
  • Linux(centos)安装安全狗
    Step1:下载linux安全狗在安全狗官网直接下载软件安装包(.tar.gz格式:safedog_linux64.tar.gz)使用finalshell将文件发送到centos指定文件夹[root@localhost~]#lsanaconda-ks.cfgoriginal-ks.cfgsafedog_linux64.tar.gzvulhubStep2:解压并安装解压缩safedog_linux64.ta......
  • linux中的knockd服务--端口敲门
    什么是端口碰撞(敲门)端口碰撞是一种通过在一组预先指定的端口上产生连接请求,从外部打开防火墙上的端口的方法。一旦收到正确的连接请求序列,防火墙规则就会被动态修改,以允许发送连接请求的主机通过特定端口进行连接。在Linux中称为Knockd服务,该服务通过动态的添加iptables规则来......