一、知识点总结
本章论述了并发编程,介绍了并行计算的概念。指出了并行计算的重要性:比较了顺序算法与并行算法,以及并行性与并发性;解释了线程的原理及其相对于进程的优势;介绍了Pthread中的线程操作,包括线程管理函数,互斥量、条件变量和屏障等线程同步工具;解释了死锁问题,并说明了如何防止并发程序中的死锁问题;讨论了信号量,并论证了它们相对于条件变量的优点;还解释了支持Linux中线程的独特方式。
(一)并行计算基础
在早期,大多数计算机只有一个处理组件,称为处理器或中央处理器(CPU)。受这种硬件条件的限制,计算机程序通常是为串行计算编写的。要求解某个问题,先要设计一种算法,描述如何一步步地解决问题,然后用计算机程序以串行指令流的形式实现该算法。在只有一个CPU的情况下,每次只能按顺序执行某算法的一个指令和步骤。但是,基于分治原则(如二叉树查找和快速排序等)的算法经常表现出高度的并行性,可通过使用并行或并发执行来提高计算速度。并行计算是一种计算方案,它尝试使用多个执行并行算法的处理器更快速地解决问题。过去,由于并行计算对计算资源的大量需求,普通程序员很少能进行并行计算。近年来,随着多核处理器的出现,大多数操作系统(如Linux)都支持对称多处理(SMP)。甚至对于普通程序员来说,并行计算也已经成为现实。显然,计算的未来发展方向是并行计算。因此,迫切需要在计算机科学和计算机工程专业学生的早期学习阶段引入并行计算。
顺序算法与并行算法
在描述顺序算法时,常用的方法是用一个begin-end代码块列出算法,如下方所示。
--- 顺序算法 ---|--- 并行算法 ---
begin | cobegin
step_1 | task_1
step_2 | task_2
... | ...
step_n | task_n
end | coend
//next step | //next step
begin-end代码块中的顺序算法可能包含多个步骤。所有步骤都是通过单个任务依次执行的,每次执行一个步骤。当所有步骤执行完成时,算法结束。相反,并行算法使用cobegin-coend代码块来指定并行算法的独立任务。在cobegin-coend块中,所有任务都是并行执行的。紧接着cobegin-coend代码块的下一个步骤将只在所有这些任务完成之后执行。
(二)并行性与并发性
通常,并行算法只识别可并行执行的任务,但是它没有规定如何将任务映射到处理组件。在理想情况下,并行算法中的所有任务都应该同时实时执行。然而,真正的并行执行只能在有多个处理组件的系统中实现,比如多处理器或多核系统。在单CPU系统中,只能执行一个任务。在这种情况下,不同的任务只能并发执行,即在逻辑上并行执行。在单CPU系统中,并发性是通过多任务处理来实现的。
(三)线程基本特点
-
线程的原理:线程是某进程同一地址空间上的独立执行单元。每个线程都可以创建更多的线程,它们在同一进程的相同地址空间中执行。通过使用线程编写并行执行的程序比使用进程编写更简单、更自然。
-
线程的优点:
- 线程的创建和切换速度更快。
- 线程的响应速度更快。
- 线程更适合并行计算。
-
线程的缺点:
- 线程需要来自用户的明确同步。
- 许多库函数可能对线程不安全。
- 在单CPU系统上,使用线程解决问题实际上要比使用顺序程序慢,这是由在运行时创建线程和切换上下文的系统开销造成的。
(四)线程操作
线程的执行轨迹与进程类似,线程可在内核模式或用户模式下执行。线程操作包括:
- 创建线程:使用pthread_create()函数来创建线程,参数包括线程id、线程属性、线程函数和参数。
- 线程终止:线程函数结束后,线程即终止。可以使用pthread_exit()函数进行显式终止。
- 线程连接:一个线程可以等待另一个线程的终止,使用pthread_join()函数进行连接。