• 2024-07-02磁盘分区?合并?看这一篇文章就够了
    一、故事开篇        你会不会有这样的诉求呢?刚买了一块磁盘,但是自己的不同资料想要分盘管理,不想一股脑地都放在同一个盘下面,也还不想再买一块盘。莫慌,你可以对一块磁盘进行分区,行话就叫“磁盘分区”。如下图我的磁盘:    (一个小知识:系统盘默认叫C盘,每加一
  • 2024-07-02BIOS设置与系统分区
                                                   
  • 2024-07-02Linux的磁盘分区、挂载,解释挂载的经典案例——如何增加一块硬盘
    (1)分区、挂载释义:①无论有几个分区(硬盘),分给哪一目录使用(Linux文件系统),它归根结底就只有一个根目录。一个独立且唯一的文件结构。每个分区都是用来组成整个文件系统的一部分。②“挂载”(Mount)是指将设备(如硬盘、光盘、USB驱动器等)中的一个分区与一个已存在的目录(挂载点)关联起
  • 2024-07-02【Spark Core】RDD详解
    一、RDD基本介绍1、为什么需要RDD没有RDD之前:1.MR:只提供了map和reduce的API,而且编写麻烦,运行效率低!---早淘汰了!2.使用Python/Scala/Java的本地集合:但是只能完成本地单机版的,如果要实现分布式的,---很困难!  所以需要有一个分布式的数据抽象,也就是用该抽象,可
  • 2024-06-24linux三剑客工具使用及硬盘知识介绍
    文本处理工具,文件查找工具,文本处理三剑客,文本格式化命令(printf)的相关命令及选项,示例。文本处理工具cat:连接文件并打印到标准输出。catfile1file2tac:反向连接文件并打印到标准输出。tacfilenl:给文件的每一行添加行号。nlfilemore:分页显示文件内容。morefilele
  • 2024-06-23Spring Batch
    项目是做历史表的Migration锁定一定数量的历史表A,B,C,每张历史表在配置表里有一张记录,包括需要distinct的关键字段,包括分区大小,core大小(逻辑分区)以及一个参数(select_clause,历史表的条件比如时间)举例子,数据库配置表里 历史表A 的distinct字段country_code到60w条数据,分
  • 2024-06-22Windows系统分区
    系统分区一,选择分区表1,MBR(主引导记录)分区表;缺陷:最大支持2.1TB的硬盘;最大支持4个主分区。分区分类:①主分区:每块硬盘最多4个②扩展分区:每块硬盘最多1个,扩展分区+主分区最多4个,扩展分区不能格式化,不能写入数据扩展分区只能用于包含更多的逻辑分区③逻辑分区:逻辑分区
  • 2024-06-22Windows系统分区 二
    [2]格式化原理Block(数据块):Linux默认大小4KB,还支持1KB,2KB    du统计文件大小    df统计空间大小如果一个文件需要占用多个Block,他会尽量依次存储,但不是绝对的。一个文件可以占用多个Block,但是一个Block只能保存一个文件的数据。Inode(索引节点):大小128Byte
  • 2024-06-22硬盘该选哪种分区
    不管是固态硬盘还是机械硬盘,在安装系统的时候,我们会遇到这样一个选项,硬盘选择MBR还是GPT分区,MBR(主引导记录)与GPT(GUID分区表)作为两种主流的硬盘分区方案各有千秋,但是又不能随便选,所以我们还是有必要了解一下他们的区别。MBR:传统硬盘的守护者MBR(MasterBootRecord),即主引导记录,是一
  • 2024-06-21通过盗版系统镜像资源传播的剪贴板劫持器分析
    概览近期,安天CERT监测到通过镜像下载站传播的攻击活动。攻击者将Torrent资源投放至Windows操作系统镜像下载站中,诱导用户安装使用看似纯净的系统。实际上,攻击者事先将恶意文件隐藏于指定路径中,通过计划任务实现自启动,并利用EFI系统分区规避安全产品的检测,最终执行剪贴板劫持器
  • 2024-06-20通过优启通PE盘安装Win7(10/11通用)
    开机前插入PE启动盘开机,同时按住UEFI启动选择镜像(不同品牌主板该按键不同,根据自己电脑主板品牌自行百度),进入PE盘启动选择项,根据自己电脑机型在[1][2]中选择一项并回车进入PE盘后,双击此电脑                           
  • 2024-06-19分布式系统的CAP定理
    CAPC:consistency一致性Allnodeseethesamedataatthesametime.A:available可用性Readsandwritealwayssucceed.即服务一直可用,且必须在正常时间内响应。P:partitiontolerance分区容错性Thesystemcontinuestooperatedespitearbitrarymessagelossor
  • 2024-06-19分区丢失数据恢复
    分区丢失了数据如何恢复呢?分区丢失是常常会出现的一种数据丢失情况,比如,硬盘上的某个盘突然不见了,丢失的分区及数据该怎么恢复呢?分区是存储设备在逻辑层面上划分的一块连续的磁盘区域。硬盘、移动硬盘等设备必须先进行分区才可以存储数据,在电脑中,操作系统还会给每个正常的分区分
  • 2024-06-19【2024最新精简版】Kafka面试篇
    文章目录Kafka和RabbitMQ什么区别讲一讲Kafka架构你们项目中哪里用到了Kafka?为什么会选择使用Kafka?有什么好处?使用Kafka如何保证消息不丢失?消息的重复消费问题如何解决的?Kafka如何保证消费的顺序性?Kafka的高可用机制有了解过嘛?Kafka实现高性能的设计有了解
  • 2024-06-18现代分布式数据库 数据分布方式 Round-Robin、Range、List 和 Hash
    现代分布式数据库中,常见的数据分布方式有如下几种:Round-Robin、Range、List和Hash。如下图所示: 数据分布|StarRockshttps://docs.starrocks.io/zh/docs/table_design/Data_distribution/StarRocks的数据分布方式​StarRocks支持单独和组合使用数据分布方式。说明除
  • 2024-06-18Spark 面试题(十六)
    1.简述Spark运行时并行度的设置?在Spark中,“并行度”(Parallelism)通常指的是作业中同时执行的任务数量。这个数量决定了在任何给定时间可以有多少任务并发运行,进而影响作业的执行效率和资源利用。以下是设置Spark运行时并行度的一些关键点:默认并行度:如果没有明确设置,Spa
  • 2024-06-18Linux系统根分区满载清理
    问题说明这里我们在使用centos7.6系统时,遇到根分区满载的问题。进入根分区后,查找了所有的目录,并没有查到大的文件。这里怀疑是文件删除未释放导致。由于系统根分区满载,执行lsof|grepdelete查看对应的已删除的文件但未释放的文件进程时,命令会卡死。这里我们只能换种别的方法进行
  • 2024-06-17Dask-权威指南-全-
    Dask权威指南(全)原文:annas-archive.org/md5/4f64056c14690c5478291f8391f41fa7译者:飞龙协议:CCBY-NC-SA4.0第一章:理解DaskDataFrames的架构DaskDataFrames允许您扩展您的pandas工作流。DaskDataFrames克服了pandas的两个关键限制:pandas无法运行大于内存的
  • 2024-06-16Spark RDD弹性分布式数据集原理与代码实例讲解
    SparkRDD弹性分布式数据集原理与代码实例讲解1.背景介绍在大数据处理领域,ApacheSpark已成为最受欢迎的框架之一。其核心组件之一是弹性分布式数据集(ResilientDistributedDataset,简称RDD)。RDD是Spark的基础抽象,提供了对大规模数据集的容错和并行处理能力。本文将
  • 2024-06-16BitLocker加密分区丢失了如何恢复?
    关于BitLocker加密分区丢失与恢复BitLocker是Windows操作系统提供的磁盘加密技术,可以更好的保护电脑中的数据。被BitLocker加密后的分区,在文件管理器中可以看到分区上会有个黄色的锁(如下图所示),双击该分区,会弹出窗口要求输入密码或是秘钥。输入正确的密码/秘钥后,即可解锁BitLocke
  • 2024-06-16【Kafka专栏 05】一条消息的完整生命周期:Kafka如何保证消息的顺序消费
    作者名称:夏之以寒作者简介:专注于Java和大数据领域,致力于探索技术的边界,分享前沿的实践和洞见文章专栏:夏之以寒-kafka专栏专栏介绍:本专栏旨在以浅显易懂的方式介绍Kafka的基本概念、核心组件和使用场景,一步步构建起消息队列和流处理的知识体系,无论是对分布式系统感兴趣,还
  • 2024-06-15Spark RDD与算子详解:案例解析(第3天)
    系列文章目录1-RDD的基本介绍(了解)2-如何构建RDD(熟悉)3-RDD的相关算子(案例详解)(掌握)4-sparkRDD算子相关面试题(重点)文章目录系列文章目录前言一、RDD的基本介绍(了解)1、什么是RDD2、RDD的五大特性3、RDD的五大特点二、如何构建RDD(熟悉)1、并行化本地集合方式2、读
  • 2024-06-15Spark 面试题(九)
    1.简述Spark的DAG以及它的生成过程?在Spark中,DAG(有向无环图)是描述作业中所有RDD转换操作依赖关系的图。DAG的生成过程是Spark作业调度的关键步骤之一。以下是对SparkDAG的简述以及它的生成过程:DAG的概念节点:DAG中的每个节点代表一个RDD。边:边表示RDD之间的依赖关系,可以
  • 2024-06-14ghost备份系统/恢复系统
    准备工作准备一个微PE镜像或者一个微PE启动U盘操作步骤我们这里用虚拟机(win10)进行模拟。首先进入到镜像微PE中(微PE镜像制作请参考微PE工具箱制作成ISO镜像-CSDN博客)进入微PE我们先进行微PE镜像的挂载。先右键虚拟机,点击设置点击如图下所示的位置,将微PE镜像挂载上,点击确
  • 2024-06-13JAVA八股文面试必会-基础篇-3.3 分库分表
    1.什么是分库分表?分库分表,是企业里面比较常见的针对高并发、数据量大的场景下的一种技术优化方案,所谓"分库分表",根本就不是一件事儿,而是三件事儿,他们要解决的问题也都不一样。这三个事儿分别是"只分库不分表”、"只分表不分库"、以及"既分库又分表"。分库分库主要解决的