相信大家在开发的过程中经常会使用到go
中并发利器channel
,channel
是CSP
并发模型中最重要的一个组件,两个独立的并发实体通过共享的通讯channel
进行通信。大多数人只是会用这么个结构很少有人讨论它底层实现,这篇文章讲写写channel
的底层实现。
channel
channel
的底层实现是一个结构体,源代码如下:
type hchan struct {
qcount uint // total data in the queue
dataqsiz uint // size of the circular queue
buf unsafe.Pointer // points to an array of dataqsiz elements
elemsize uint16
closed uint32
elemtype *_type // element type
sendx uint // send index
recvx uint // receive index
recvq waitq // list of recv waiters
sendq waitq // list of send waiters
// lock protects all fields in hchan, as well as several
// fields in sudogs blocked on this channel.
//
// Do not change another G's status while holding this lock
// (in particular, do not ready a G), as this can deadlock
// with stack shrinking.
lock mutex
}
可能看源代码不是很好看得懂,这里我个人画了一张图方便大家查看,我在上面标注了不同颜色,并且注释其作用。
通道像一个传送带
或者队列
,总是遵循FIFO
的规则,保证收发数据的顺序,通道是goroutine
间重要通信的方式,是并发安全的。
buf
hchan
结构体中的buf
指向一个循环队列,用来实现循环队列,sendx
是循环队列的队尾指针,recvx
是循环队列的队头指针,dataqsize
是缓存型通道的大小,qcount
是记录通道内元素个数。
在日常开发过程中用的最多就是ch := make(chan int, 10)
这样的方式创建一个通道,如果这要声明初始化的话,这个通道就是有缓冲区的,也是图上紫色的buf
,buf
是在make
的时候程序创建的,它有元素大小*元素个数
组成一个循环队列,可以看做成一个环形结构,buf
则是一个指针指向这个环。
上图对应的代码那就是ch = make(chan int,6)
,buf
指向这个环在heap
上的地址。
func makechan(t *chantype, size int) *hchan {
elem := t.elem
// compiler checks this but be safe.
if elem.size >= 1<<16 {
throw("makechan: invalid channel element type")
}
if hchanSize%maxAlign != 0 || elem.align > maxAlign {
throw("makechan: bad alignment")
}
mem, overflow := math.MulUintptr(elem.size, uintptr(size))
if overflow || mem > maxAlloc-hchanSize || size < 0 {
panic(plainError("makechan: size out of range"))
}
// Hchan does not contain pointers interesting for GC when elements stored in buf do not contain pointers.
// buf points into the same allocation, elemtype is persistent.
// SudoG's are referenced from their owning thread so they can't be collected.
// TODO(dvyukov,rlh): Rethink when collector can move allocated objects.
var c *hchan
switch {
case mem == 0:
// Queue or element size is zero.
c = (*hchan)(mallocgc(hchanSize, nil, true))
// Race detector uses this location for synchronization.
c.buf = c.raceaddr()
case elem.ptrdata == 0:
// Elements do not contain pointers.
// Allocate hchan and buf in one call.
c = (*hchan)(mallocgc(hchanSize+mem, nil, true))
c.buf = add(unsafe.Pointer(c), hchanSize)
default:
// Elements contain pointers.
c = new(hchan)
c.buf = mallocgc(mem, elem, true)
}
c.elemsize = uint16(elem.size)
c.elemtype = elem
c.dataqsiz = uint(size)
lockInit(&c.lock, lockRankHchan)
if debugChan {
print("makechan: chan=", c, "; elemsize=", elem.size, "; dataqsiz=", size, "\n")
}
return c
}
上面就是对应的代码实现,上来它会检查你一系列参数是否合法,然后在通过mallocgc
在内存开辟这块空间,然后返回。
sendx and recvx
下面我手动模拟一个ring
实现的代码:
// Queue cycle buffer
type CycleQueue struct {
data []interface{} // 存放元素的数组,准确来说是切片
frontIndex, rearIndex int // frontIndex 头指针,rearIndex 尾指针
size int // circular 的大小
}
// NewQueue Circular Queue
func NewQueue(size int) (*CycleQueue, error) {
if size <= 0 || size < 10 {
return nil, fmt.Errorf("initialize circular queue size fail,%d not legal,size >= 10", size)
}
cq := new(CycleQueue)
cq.data = make([]interface{}, size)
cq.size = size
return cq, nil
}
// Push add data to queue
func (q *CycleQueue) Push(value interface{}) error {
if (q.rearIndex+1)%cap(q.data) == q.frontIndex {
return errors.New("circular queue full")
}
q.data[q.rearIndex] = value
q.rearIndex = (q.rearIndex + 1) % cap(q.data)
return nil
}
// Pop return queue a front element
func (q *CycleQueue) Pop() interface{} {
if q.rearIndex == q.frontIndex {
return nil
}
v := q.data[q.frontIndex]
q.data[q.frontIndex] = nil // 拿除元素 位置就设置为空
q.frontIndex = (q.frontIndex + 1) % cap(q.data)
return v
}
循环队列一般使用空余单元法来解决队空和队满时候都存在font=rear
带来的二义性问题,但这样会浪费一个单元。golang
的channel
中是通过增加qcount
字段记录队列长度来解决二义性,一方面不会浪费一个存储单元,另一方面当使用len
函数查看队列长度时候,可以直接返回qcount
字段,一举两得。
当我们需要读取的数据的时候直接从recvx
指针上的元素取,而写就从sendx
位置写入元素,如图:
sendq and recvq
当写入数据的如果缓冲区已经满或者读取的缓冲区已经没有数据的时候,就会发生协程阻塞。
如果写阻塞的时候会把当前的协程加入到sendq
的队列中,直到有一个recvq
发起了一个读取的操作,那么写的队列就会被程序唤醒进行工作。
当缓冲区满了所有的g-w
则被加入sendq
队列等待g-r
有操作就被唤醒g-w
,继续工作,这种设计和操作系统的里面thread
的5
种状态很接近了,可以看出go
的设计者在可能参考过操作系统的thread
设计。
当然上面只是我简述整个个过程,实际上go
还做了其他细节优化,sendq
不为空的时候,并且没有缓冲区,也就是无缓冲区通道,此时会从sendq
第一个协程中拿取数据,有兴趣的gopher
可以去自己查看源代码,本文也是最近笔者在看到这块源代码的笔记总结。