信号的保存和捕捉
信号的保存
与信号相关的常见概念
- 实际执行信号的处理动作称为信号的递达(Delivery)
- 信号从产生到递达之间的状态,称为信号未决(Pending)
- 进程可以选择阻塞(Block)某个信号
- 被阻塞的信号产生时将保持再未决状态,之道进程解除对此信号的阻塞,才执行递达的动作
信号在内核中的表示
图中所示的block和pending都是位图结构,比特位的位置代表的就是信号的编号,在block表中,若某个比特位为1,则代表该信号已经被阻塞了,无法被递达。在pending表中若某个比特位为1,则代表该信号已经被收到。
- 每个信号都有两个标志位分别表示阻塞和未决,还有一个函数指针表示处理动作。信号产生时,内核在进程控制块中设置该信号的未决标志,直到信号递达才清除该标志,在上图的例子中,SIGHUP信号既没有阻塞也没有产生过,所以当它递达时会执行该信号的默认处理动作
- SIGINT信号产生过,但是因为被阻塞了,所以暂时不能够递达。虽然它的处理动作时忽略该信号
- SIGQUIT信号未产生过,一旦产生SIGQUIT信号将被阻塞。如果对于SIGQUIT信号的阻塞接触,那么就会执行用户自定义的处理动作sighandler。
若在进程解除对某个信号的阻塞之前这种信号产生多次,将如何处理?
Linux中实现方式:常规信号在递达之前产生多次只计一次,而实时信号在递达之前产生多次可以依次放到一个队列中。(本文主要讨论的是常规信号)
信号集操作函数
sigset_t
从上图来看,每个信号只有一个bit的未决标志,非0即1,不记录该信号产生了多少次,阻塞标志也是这样表示的。因此,未决和阻塞标志可以用相同的数据类型sigset_t来存储,sigset_t称为信号集(就是一个类似于位图一样类型),这个类型可以表示每个信号的“有效”或“无效”状态,在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞,而在未决信号集中“有效”和“无效”的含义是该信号是否处于未决
sigset_t类型对于每种信号用一个bit表示“有效”或“无效”状态,至于这个类型内部如何存储这些bit则依赖于系统实现,从使用者的角度是不必关心的,使用者只需要也只能调用以下函数来操作sigset_ t类型的变量
#include <signal.h>
int sigemptyset(sigset_t *set);
int sigfillset(sigset_t *set);
int sigaddset (sigset_t *set, int signo);
int sigdelset(sigset_t *set, int signo);
int sigismember(const sigset_t *set, int signo);
sigemptyset:初始化set所指向的信号集,使其中所有信号对应的bit位清0,表示该信号集中不包含任何有效信号
sigfillset:初始化set所执行的信号集,使其中所有的信号对应的bit位置1,表示该信号集中有效信号包含了系统支持的所有信号
sigaddset和sigdelset:在信号集中添加或删除某种有效信号
以上函数的返回值都是成功返回0,失败返回-1
sigismember:用于判断一个信号集中的有效信号是否包含某个信号,若包含则返回1,不包含则返回0
sigprocmask
调用sigprocmask函数可以读取或者更改进程的信号屏蔽字(阻塞信号集)
返回值:成功返回0,失败返回-1
如果oset是一个非空指针,则会读取当前的信号屏蔽字并通过oset参数传出。如果set是非空指针,则会更改进程的信号屏蔽字。参数how指示如何更改
若set和oset都是非空指针,则会会将原有的信号屏蔽字备份到oset中并根据参数how和参数set更改吸信号屏蔽字。假设当前的信号屏蔽字为mask,下表则说明了参数how的可选值
选项 | 作用 |
---|---|
SIG_BLOCK | set包含了我们希望添加到当前信号屏蔽字的信号相当于mask=make|set |
SIG_UNBLOCK | set包含了我们希望从当前信号屏蔽字中解除阻塞的信号,相当于mask=mask&~set |
SIG_SETMASK | 设置当前信号屏蔽字为set所指向的值,相当于mask=set |
sigpending
读取当前进程的未决信号集,通过参数set传出,调用成功则返回0,出错则返回-1
信号的捕捉
信号什么时候被处理?
当进程从内核态切换回用户态的时候,信号就会被检测并被处理。
即使是在没有中断、异常或者使用系统调用的情况下,进程也会有从内核态切换为用户态的过程(进程中存在时间片,当时间片的时间满了之后,该进程就需要让出CPU,这个过程就需要切换到内核态让操作系统执行它设定好的进程调度程序)。唤醒时该进程又会从内核态切换回用户态
为什么我们在信号捕捉的时候,执行我们写的方法,还要从内核态切换回用户态?
如果用户写的方法是一些越权的非法操作,如果我们将这些操作写进信号捕捉方法里,操作系统如果以它的身份执行这些方法,权限就出现了漏洞
进程具体如何找到操作系统?如何以操作系统的身份使用系统调用
以上是一个及简易版本的进程地址空间,如图所示,地址空间分为两个部分,分别是用户空间和内核空间。内核空间中映射的就是物理内存中操作系统程序
其中,内核空间中有一个函数指针数组,里面的指针指向的就是各种系统调用,数组元素的下标被称为系统调用号,当需要使用系统调用时,就只需要通过这个函数指针数组的地址和系统调用号(也就是数组下标)来找到对应的系统调用并执行
当需要执行系统调用时,程序会将系统调用号和参数放到对应的寄存器中,然后模仿硬件中断形成一个内部中断,然后操作系统从寄存器中读到系统调用号,然后操作系统找到自己的方法表,然后索引表,执行系统调用。
但是执行系统调用包括找到根据系统调用号找到对应的系统调用需要状态为内核态,那么如何进行状态的识别和切换呢?
如何进行内核态和用户态之间的切换
在CPU中有一个寄存器CR3
用来指向任何一个进程的页表的,还存在一个寄存器CS
,它的低两位bit位被称为是权限标识位,0:表示内核态 3:表示用户态,所以在进行一些操作时还要检查CS
中的权限标识位对当前用户的身份进行审核
所以内核态和用户态之间的跳转实质上是CS寄存器中权限位的修改
内核如何实现信号的捕捉
如果信号的处理动作是用户自定义函数,在信号递达时就调用这个函数,这称为捕捉信号。由于信号处理函数的代码是在用户空间的,处理过程比较复杂,举例如下: 用户程序注册了SIGQUIT信号的处理函数sighandler。 当前正在执行main函数,这时发生中断或异常切换到内核态。
在中断处理完毕后要返回用户态的main函数之前检查到有信号SIGQUIT递达。 内核决定返回用户态后不是恢复main函数的上下文继续执行,而是执行sighandler函数,sighandler和main函数使用不同的堆栈空间,它们之间不存在调用和被调用的关系,是 两个独立的控制流程。 sighandler函数返回后自动执行特殊的系统调用sigreturn再次进入内核态。 如果没有新的信号要递达,这次再返回用户态就是恢复main函数的上下文继续执行了
sigaction
sigaction是一个类似于signal的读取和修改指定信号相关联的操作,调用成功则返回0,失败则返回-1。signo是指定信号的编号。若act指针非空,则根据act修改该信号的处理动作。若oact指针非 空,则通过oact传出该信号原来的处理动作。act和oact指向sigaction结构体
下面来介绍以下结构体中部分变量的含义(第二个参数和最后一个参数用来处理实时信号的,本文不讨论实时信号)
void (*sa_handler)(int)
:将sa_handler赋值为常数SIG_IGN传给sigaction表示忽略信号,赋值为常数SIG_DFL表示执行系统默认动作,赋值为一个函数指针表示用自定义函数捕捉信号,或者说向内核注册了一个信号处理函 数,该函数返回值为void,可以带一个int参数,通过参数可以得知当前信号的编号,这样就可以用同一个函数处理多种信号。显然,这也是一个回调函数,不是被main函数调用,而是被系统所调用
sigset_t sa_mask
:用于处理当前被捕捉信号时屏蔽其他信号,避免处理当前信号被其他信号所干扰
int sa_flags
:该字段主要是用于设置选项在 sigaction 结构体中,sa_flags 是一个用于指定信号处理行为的标志位集合。具体来说,它是一个整数类型的字段,可以通过按位操作来设置或获取不同的标志位。在 POSIX 标准中,sa_flags 可能包括以下标志位:
- SA_NOCLDSTOP:子进程停止时不发送 SIGCHLD 信号。默认情况下,子进程停止时会发送SIGCHLD 信号给父进程。
- SA_NOCLDWAIT:父进程不阻塞等待子进程状态改变。如果设置了这个标志,父进程不会自动回收子进程的状态信息,需要显式调用 waitpid() 或类似的函数来处理子进程状态改变。
- SA_NODEFER:允许在信号处理程序执行期间重新投递同一种类的信号。默认情况下,当信号处理程序执行时,相同类型的信号会被阻塞,直到信号处理程序执行完毕。
以上仅罗列部分标志位,更多标志位可查看文档
关于sigaction和信号处理的一点细节
当某个信号的处理函数被调用时,内核自动将当前信号加入进程的信号屏蔽字(不想让信号被嵌套式的处理),当信号处理函数返回时自动恢复原来的信号屏蔽字,这样就保证了在处理某个信号时,如果这种信号再次产生,那么 它会被阻塞到当前处理结束为止。 如果在调用信号处理函数时,除了当前信号被自动屏蔽之外,还希望自动屏蔽其他信号,则用sa_mask字段说明这些需要额外屏蔽的信号,当信号处理函数返回时自动恢复原来的信号屏蔽字
补充
SIGCHLD信号
对于进程我们知道,父进程可以通过wait
和waitpid
函数处理结束的子进程。父进程既可以阻塞等待子进程也可以非阻塞查询子进程(轮询),当使用第一种方式时,父进程就不能再去执行自己的代码而只能一直处于阻塞状态,对于第二种方式,实现起来就更为复杂了。有没有更好的方法?其实是有的
当子进程结束后,会向父进程发送SIGCHLD信号,该信号的默认处理动作是忽略。所以我们只需要自定义该信号的处理函数,这样父进程只需专心处理自己的工作,不必关心子进程了,子进程 终止时会通知父进程,父进程在信号处理函数中调用wait清理子进程即可。
事实上,由于UNIX 的历史原因,要想不产生僵尸进程还有另外一种办法:父进程调 用sigaction将SIGCHLD的处理动作置为SIG_IGN,这样fork出来的子进程在终止时会自动清理掉,不 会产生僵尸进程,也不会通知父进程。系统默认的忽略动作和用户用sigaction函数自定义的忽略 通常是没有区别的,但这是一个特例。此方法对于Linux可用,但不保证在其它UNIX系统上都可用
可重入函数
main函数调用insert函数向一个链表head中插入节点node1,插入操作分为两步,刚做完第一步的 时候,因为硬件中断使进程切换到内核,再次回用户态之前检查到有信号待处理,于是切换 到sighandler函数,sighandler也调用insert函数向同一个链表head中插入节点node2,插入操作的 两步都做完之后从sighandler返回内核态,再次回到用户态就从main函数调用的insert函数中继续 往下执行,先前做第一步之后被打断,现在继续做完第二步。结果是,main函数和sighandler先后 向链表中插入两个节点,而最后只有一个节点真正插入链表中了。
像上例这样,insert函数被不同的控制流程调用,有可能在第一次调用还没返回时就再次进入该函数,这称为重入,insert函数访问一个全局链表,有可能因为重入而造成错乱,像这样的函数称为不可重入函数,反之,如果一个函数只访问自己的局部变量或参数,则称为可重入(Reentrant) 函数。
如果一个函数符合以下条件之一则是不可重入的:
- 调用了malloc或free,因为malloc也是用全局链表来管理堆的。
- 调用了标准I/O库函数。标准I/O库的很多实现都以不可重入的方式使用全局数据结构。