首页 > 其他分享 >抛砖系列之git仓库拆分工具git-filter-repo

抛砖系列之git仓库拆分工具git-filter-repo

时间:2022-09-01 17:45:30浏览次数:88  
标签:filter git 抛砖 仓库 trade repo order

最近负责把团队内的git仓库做了一次分拆,解锁一个好用的工具git-filter-repo,给大伙抛砖一波,希望以后遇到类似场景时可以信手拈来。

背景

笔者团队目前是把业务相关的java项目都放到了一个git仓库中,发展初期项目较少放到一块图的就是一个方便,但是几年下来随着项目、人员、玩法等多了以后逐渐显现出一些问题,主要痛点有以下:
1.效率:更新代码缓慢,会下载很多我不关心的内容,既影响开发效率也影响jenkins打包的效率;
2.冲突:合并代码冲突率显著增高,而且一旦冲突往往很难解决,兄弟们苦不堪言,代码合并相互推诿;
3.权限:需要遵循最小范围、按需授权等原则最大限度保证代码不外泄,现有的“大锅饭”模式显然不满足。

期望

拆分以后每个项目一个git仓库,需要保留历史提交记录,方便以后回溯。

 

 为了说明问题,上图是我以交易业务域为场景假想了一个简化版仓库,trade仓库下涵盖了三个java项目,分别是discount、order、paygate,拆分以后会变成discount、order、paygate三个仓库。

第一次尝试

我初次拿到这个任务的时候想,这个很简单啊,把trade复制三份然后分别改名为trade-order、trade-paygate、trade-discount,并把多余的删除,看起来像这样: 

 

 

 

 

仓库拆分第一步似乎已经完成,接下来看看历史记录有没有丢失:

1.单个文件提交历史是否完整—右键order_readme.txt->git->show history(idea集成的查看文件git历史功能),很完整,没有问题。

 

 

2.新仓库提交历史是否完整—右键trade-order->git->show history,初看没什么问题,再看似乎不够完美,trade-order包含了拆分之前所有的提交历史,虽然不影响使用,但提交历史多了同样影响效率,必须再优化一波。

 

 

 

第二次尝试

第一次拆分之后的trade-order之所以包含所有提交历史是因为我选择的拆分策略是将原来的仓库复制出来然后删除多余的项目,对于提交历史并没有特殊处理,git的提交历史在.git目录下,真实的仓库.git目录接近900兆,这次的目标是将多余的提交历史剔除,靠人工剔除不现实,需要寻觅一款趁手的工具来行使清道夫的职责。

 

网络上对于git仓库拆分大致有三类工具,分别是subtree、filter-branch、filter-repo,filter-repo虽属后起之秀,似乎有取而代之前二者的趋势,同时前二者也有不少的追捧着,一时间不好抉择。

 

机缘巧合下看到了github官方的一篇文章https://docs.github.com/cn/get-started/using-git/splitting-a-subfolder-out-into-a-new-repository,里面提到的拆分工具也是filter-repo,我也就选择跟风一次,毕竟只是临时用到的一个工具,没必要花太多时间去选型,走不通了立马切换都来得及,毕竟试错的成本很低,这里顺便啰嗦一句,如果是一个技术框架、中间件的选型可不能这么草率,不能简单的说大厂都用了我们就用,还是要结合实际情况去斟酌,比如公司技术栈、团队人员配比、运维熟悉度等多纬度综合考虑,毕竟是要长期运行且替换的代价巨大。

 

关于git-filter-repo的下载安装请前往推荐阅读2中的地址自行获取,这里就不啰嗦,下面我们直接开始。

1.打开 Git Bash

2.克隆要拆分的仓库

git clone https://xxx/trade

3.将当前工作目录更改为您克隆的仓库

cd trade

4.要从仓库中的其余文件过滤出该子文件夹,请运行 git filter-repo,提供以下信息:

--path FOLDER-NAME:项目中您要从其创建单独仓库的文件夹。

git filter-repo --path order/

5.将仓库改名为trade-order

现在,该仓库应仅包含order目录下的内容。

 

验证下提交历史:

1.单文件提交历史没有问题,如下图

 

 2.仓库整体提交历史没有问题,只包含order目录下文件的提交历史,没有把其他的带过来,如下图

 

 这次应该是稳了,我跟同事炫耀我的劳动成果,迫切的希望得到他们的赞许,结果换来的却是另一个新问题:“这个结构是不是能优化下,现在仓库是两级trade-order/order,能不能只保留order这一级。”

第三次尝试

虽然上面的“trade-order/order“看起来也能用,但是多一级无用目录的确有点丑陋,而且会徒增新同学的困惑,说干就干,继续优化。

 

使用--subdirectory-filter指令保留order/下内容并将order提升为根目录

 git filter-repo --subdirectory-filter order/ 

现在目录变成了下面这样

trade-order/

    .git/

    doc/

       order_readme.txt

最后只需要将trade-order改名为order即可大工告成,提交历史也完整的保留了下来。

 

 

 

推荐阅读

1.https://docs.github.com/cn/get-started/using-git/splitting-a-subfolder-out-into-a-new-repository

2.https://github.com/newren/git-filter-repo

3.https://htmlpreview.github.io/?https://github.com/newren/git-filter-repo/blob/docs/html/git-filter-repo.html#EXAMPLES

 

文中只是提及了git-filter-repo的部分指令,更多有意思的玩法请前往推荐阅读3中的EXAMPLES自行解锁。

 

最后献图一张,下雨天拍到一只出来放风的小蜗牛

 

 

  

  

 

 

 

  

标签:filter,git,抛砖,仓库,trade,repo,order
From: https://www.cnblogs.com/chopper-poet/p/16642807.html

相关文章

  • 利用shell脚本完成git自动拉取、同步
    #!/bin/bash#paras:$1dir#configsectionUSER=ShawnREMOTE_PATH="~/path/${USER}/${1}"######################functioncurrent_branch(){gitrev-parse......
  • Git的基础使用与远程仓库连接
    创建一个git区(本地版本库),在项目文件夹中右键菜单,点击GitBashhere,打开Git命令框使用gitinit往里面添加文件使用gitadd文件名添加使用gitstatus查看是否添加......
  • git查看历史和根据历史里面的id切换
    查看历史gitlog--pretty=onelinegitlog(然后一直按enter键)一个是切换根据历史里面的id切换gitcheckoutID gitlog需要不断按enter键出来历史提交记录  g......
  • git-从master拉取新分支并push到远端
    从master拉取新分支并push到远端 开发过程中经常用到从master分支copy一个开发分支: 1.切换到被copy的分支(master),并且从远端拉取最新版本 $gitcheckoutmaster ......
  • Git规范管理
    一、背景​统一规范后,对于后面的一系列的开发过程由系统完成,从而提高研发效率,避免各种意外情况。 二、分支管理master分支对应线上,系统上线时。平时进行需求......
  • 微信开发者工具拉取gitlab远程代码报Pull failed原因分析:
    可能出现的原因:本地主机上没有安装nodenode下载地址:1https://nodejs.org/zh-cn/download/ 没有保存gitlab的用户名和密码  ......
  • 安装git
    1.1去官网下载配置环境变量Test1.3配置gitconfig1.4配置idea1.5安装插件这里我已经安装过了......
  • 学习如何将代码从 VSCode 推送到 GitHub
    学习如何将代码从VSCode推送到GitHub您是一名开发人员,大部分时间都在通过在不同窗口之间切换来编辑代码、查看更改以及将代码从VSCode推送到GitHub来消耗大部分时......
  • GitHub——自动发布NPM包
    前言原理很简单,就是利用github的actions去触发上传到npm平台;内容?>主要分为两个步骤:1.在NPM平台生成token2.github配置secrets/actionsNPM生成token登录npm平......
  • GitHub——Error: Process completed with exit code 126.
    前言如题,github的actions在执行脚本的时候提示权限不足,既然权限不足,那就赋予权限呗,于是查了下git文档,还真有这个命令;gitupdate-index:gitupdate-index内容报......