首页 > 其他分享 >一个操作系统的设计与实现——第26章 多处理器(下):应用处理器引导

一个操作系统的设计与实现——第26章 多处理器(下):应用处理器引导

时间:2024-09-01 10:37:34浏览次数:9  
标签:引导 26 多处理器 BSP TSS AP 处理器 CPU

26.1 应用处理器

当计算机启动时,不管其中有多少个CPU,都只有一个CPU会真正启动,这个CPU就称为引导处理器(Bootstrap Processor,BSP);而其他CPU会等待被BSP唤醒,这些CPU就称为应用处理器(Application Processor, AP)。

BSP可以在任意时刻向所有AP广播唤醒信号,当AP接受到信号后,就会启动BIOS,随后跳转到操作系统为其提供的引导程序处继续执行。具体来说,唤醒功能由LAPIC提供,想要唤醒AP时,BSP应先向0xfee00300发送固定的0x000c4500,再向同一地址发送0x000c4600 | AP引导程序的第12~19位。也就是说,AP引导程序需要满足以下两个条件:

  1. 只能使用20位内存地址
  2. 对齐到0x1000

在我们的操作系统中,AP引导程序位于硬盘的1号扇区,并加载到0x8000处,能够满足上述条件。

需要指出的是:笔者发现在bochs中,上述两次发送不能连续进行,而是需要在中间添加一个"跳转到下一行"的指令,这可能是bochs的一个bug。这个指令的机器语言为:db 0xeb, 0x0

AP的引导时机是可以自由选择的。这意味着:AP引导程序可以使用各种现成的组件,如PML4、GDTR、IDTR等,这就使得AP引导程序是非常简单的,其是BSP引导过程的简化版。

26.2 LAPIC的开关

默认状态下,只有BSP的LAPIC是打开的,可以直接使用,而AP的LAPIC是关闭的。LAPIC的开关位于0xfee000f0地址处的第8位,将其置1即可打开LAPIC。

26.3 AP的自我识别

每个CPU都有一个编号,BSP的编号是0,AP的编号从1开始向后顺延。编号由LAPIC提供,位于0xfee00020地址处的第24~31位。

26.4 引导AP前的准备

每个CPU的寄存器是独立的,但内存是共享的。因此,PML4,GDT,IDT等位于内存中的组件均可在CPU之间共享,而GDTR,IDTR可使用sgdt/sidt存入内存后共享。

TSS用于获取任务的0特权级栈,由于每个CPU都会运行一个任务,因此TSS不能在CPU之间共享,而是应该为每个CPU分别安装一个。

请看本章代码26/Mbr.s

第156~158行,在GDT中再安装3个TSS描述符。这些TSS的地址从0xffff800000092000 + 128开始向后顺延,每个TSS的大小拓展到128字节。

接下来,请看本章代码26/Task.hpp

第10行,定义CPU的数量为4。也就是说,我们的操作系统固定使用1个BSP和3个AP。

第16行,将所有TSS清零。

第18~21行,关闭所有TSS的IO位图功能。

26.5 AP引导程序的实现

AP的引导是在操作系统启动后期才开始的,此时的操作系统处于IA32-e模式,使用的是64位ELF格式的代码,但AP处于实模式,不能使用64位ELF格式的代码。因此,AP的引导分为两阶段进行:

  • 第一阶段:利用现成的GDT和PML4快速进入IA32-e模式。这一阶段的引导程序是独立的,其位于硬盘的1号扇区
  • 第二阶段:在IA32-e模式下继续引导。这段引导程序是内核的一部分

请看本章代码26/AP.h

第3行,声明了apInit函数。这个函数是用汇编语言实现的。

接下来,请看本章代码26/AP.s

第10行,定义CPU的数量为4。

第18~21行,为AP引导程序准备信息,这些信息如下表所示:

地址 字节数 含义
0x7e00 10 GDTR
0x7e10 10 IDTR
0x7e20 8 AP的第二阶段引导程序的入口

第23~26行,将AP的第一阶段引导程序从1号扇区读取到0x8000处。

第28~31行,向AP广播唤醒信号。

第33~36行,等待所有AP引导完成。这段代码的原理见下。

接下来,请看本章代码26/APBoot.s

APBoot.s是AP的第一阶段引导程序,其相当于简化版的Mbr.s

第3行,直接从0x7e00加载GDTR。GDTR已经由BSP准备完毕。

第5~24行,进入保护模式并初始化所有段寄存器。

第26~27行,直接安装BSP已经准备好的PML4。

第29~42行,进入IA32-e模式。

第48行,跳转到AP的第二阶段引导程序。

接下来,请看本章代码26/AP.s

apBoot64函数是AP的第二阶段引导程序,其实现可以对照Kernel.c,如下表所示:

BSP AP
printInit 不需要
memoryInit 不需要
intInit 需要初始化APIC,并lidt [0x7e10]
taskInit 需要安装TR、IA32_GS_BASE以及内核任务
fsInit 不需要
keyboardInit 不需要
syscallInit 需要,可直接调用syscallInit函数
apInit 不需要
shellInit 不需要
sti 需要
for (;;) 需要
deleteTask 不需要
hlt 需要

第46~47行,直接从0x7e00加载64位的GDTR,从0x7e10加载64位的IDTR。GDTR与IDTR已经由BSP准备完毕。

第49~51行,取得AP的编号。

第53~56行,计算AP的TCB地址。计算公式为:TCB地址 == 0xffff8000000a0000 - (AP编号 + 1) * 0x1000

第58行,安装0特权级栈。

第60~61行,打开LAPIC。

第62~64行,设定LAPIC定时器。

第66~70行,设定IO APIC中的时钟中断。

第72~74行,安装TR。计算公式为:tr选择子 == (AP编号 * 2 + 7) << 3

第76~83行,安装IA32_GS_BASE。其值等于AP的TSS地址,计算公式为:gs段基址 == TSS地址 == 0xffff800000092000 + AP编号 * 128

第85~87行,安装内核任务。

第89行,安装快速系统调用。

至此,AP引导完毕。

第91行,在总线锁定状态下将apInitFlag加1。apInitFlag是一个初值为1的计数器,当其值增加到4时,就表示所有AP均引导完毕。

第93行,打开中断。

至此,AP也能参与时钟中断,并切换到其他任务执行了。现在的taskQueue中一共存在5个永不退出的任务,它们分别是:

  • 一个带有任务回收功能的任务
  • 三个无操作任务
  • 一个外壳程序

在任意时刻,这些任务被哪个CPU执行是未知的,也就是说,BSP与AP现在已经没有区别了。

第95~98行,挂起AP。构成上述三个无操作任务中的一个。

第100~101行,定义AP初始化计数器apInitFlag

26.6 编译与测试

首先,bochs在默认状态下只有一个CPU。在其配置文件中增加一行:cpu: count=4,即可使bochs启用4个CPU。

本章代码26/Makefile增加了APBoot.sAP.s的编译与链接命令。

本章代码26/Kernel.c测试了多处理器环境下的任务切换。现在, 当多次加载Test.c任务后,所有任务的总运行时间应明显加快。

至此,我们已经实现了一个64位多处理器操作系统。

标签:引导,26,多处理器,BSP,TSS,AP,处理器,CPU
From: https://www.cnblogs.com/yingyulou/p/18391072

相关文章

  • 学习爬虫day26-kanzhun请求加密与逆向解密
    找到入口之后,在主js文件中,模拟入口函数,生成需要的参数:functiontest(n){letM=window.loader(12210)//console.log(M._A())lets=M.A()//letn='{"cityCode":"","salaryId":"403","experienceId":"","pageNum......
  • 一个操作系统的设计与实现——第25章 多处理器(上):多处理器同步原语
    25.1多处理器同步原语的实现原理当计算机中存在不止一个CPU时,基于关中断的同步原语就失效了。这是因为每个CPU的中断是独立的,关闭一个CPU的中断并不会影响其他CPU。从本质上说,中断由rflags控制,但rflags在每个CPU中都有一个,因此,只有找到一个共享区域,才能实现多CPU间的同步原语。......
  • ISO 26262中的失效率计算:SN 29500-4 Expected values for passive components
    目录概要1基准条件下的失效率2失效率转换2.1失效率预测模型2.2电压应力系数2.2.1电压应力系数计算模型2.2.2电压应力系数计算2.3温度应力系数2.3.1温度应力系数计算模型2.3.2温度应力系数计算2.4质量系数3任务剖面应力系数4早期失效系数概要SN29......
  • atc 经典dp 26题 题型总结
    题目链接稍微记录下吧。主要想发现他这个题单主人是怎么去分类dp的类型的。借鉴题目不一定要多难。但是题型的分类总结感觉很重要。某种dp的处理方式。。他是相似的。。AB数组前面往i+1,i+2.。。这样的推。C限制只能交叉继承。。不能继承pre一样位置的。他每......
  • PyTorch深度学习实战(26)—— PyTorch与Multi-GPU
    当拥有多块GPU时,可以利用分布式计算(DistributedComputation)与并行计算(ParallelComputation)的方式加速网络的训练过程。在这里,分布式是指有多个GPU在多台服务器上,并行指一台服务器上的多个GPU。在工作环境中,使用这两种方式加速模型训练是非常重要的技能。本文将介绍PyTorch中......
  • 编码技术跃迁,H.265高效编码赋能EasyCVR视频汇聚平台的5大优势
    随着科技的飞速发展和社会的不断进步,视频压缩编码技术已经成为视频传输和存储中不可或缺的一部分。在众多编码标准中,H.265(HEVC,HighEfficiencyVideoCoding)和H.264(AVC,AdvancedVideoCoding)是最为重要的两种。本文将深入分析H.265与H.264编码的区别,并探讨EasyCVR视频汇聚平台在视......
  • 大功率舞台灯调光调色方案 | 支持深度调光,多路输出调光 36V/48V/60V FP7126
    在舞台演出中,灯光扮演着非常重要的角色,它不仅可以烘托氛围,营造氛围,更能够为表演者增添光彩,塑造形象。在博物馆场所中,突出展品细节。根据灯光用途和适用类型,舞台灯可以细分为聚光灯、泛光灯、效果灯具等。在舞台照明行业,高功率舞台灯所需的稳定电源供应至关重要。此次方案以3......
  • Springmvc中的处理器、拦截器、过滤器的执行时机
    Springmvc中的处理器、拦截器、过滤器的执行时机测试案例:publicclassMyFilterimplementsFilter{@Overridepublicvoidinit(FilterConfigfilterConfig)throwsServletException{System.out.println("--->>MyFilter.init");}@Override......
  • ESP8684 系列芯片搭载 RISCV 32 位单核处理器的极低功耗 SoC 支持(2.4 GHz WiFi) 和 B
    ESP8684系列芯片搭载RISCV32位单核处理器的极低功耗SoC支持(2.4GHzWiFi)和Bluetooth5(LE)ESP8684系列芯片搭载RISCV32位单核处理器的极低功耗SoC支持IEEE802.11b/g/n(2.4GHzWiFi)和Bluetooth5(LE)在4×4mm的QFN封装中叠封1MB、2MB或4MBf......
  • 洛谷 P2680 [NOIP2015 提高组] 运输计划
    洛谷P2680[NOIP2015提高组]运输计划题意给出一棵树和\(m\)条路径,可以选择一条边,把边权改为\(0\),求\(m\)条路经长度最大值的最小值。思路看到最大值最小,可以想到二分答案,答案具有单调性。考虑如何判定答案\(x\)是否可行。统计所有长度大于\(x\)的路径,统计它们共......