数据初始化
书接上篇,我们了解了 Go 语言的指针类型。那到目前为止,Go 的数据类型就差不多介绍完了,下面就是讲解更优雅地对 Go 数据的初始化了。
这里的数据初始化是指对某个数据类型的值或变量的初始化。我们知道,在 Go 语言中,几乎所有的数据类型的值都可以使用字面量来进行表示和初始化。在大多数情况下,使用字面量就能满足初始化值或变量的要求。
除了上面说到的字面量的初始化方式,Go 语言还提供了两个专门用于数据初始化的内建函数 new 和 make。
1. 内建函数 new
new 函数用于为值分配内存。与其他编程语言(如 Java)中的 new 不同的是,它并不会去初始化分配到的内存,而只会清零它。因此调用表达式 new(T) 被求值时,所做的是为 T 类型的新值分配并清零一块内存空间,然后将这块内存空间的地址作为结果返回。而这个结果就是指向这个新的 T 类型值的指针值。它的类型为 *T。实际上这个 new 函数返回的 *T 类型值总会指向一个 T 类型的零值。
例如,调用表达式
new(string)
的求值结果指向的是一个string
类型的零值""
,而调用表达式new([3]int)
的求值结果指向的则是一个[3]int
类型的零值[3]int{0, 0, 0}
。
正因为有这种干净的内存分配策略,使得我们可以在用内建函数 new 创建某个数据类型的新值之后立刻就可以拿来使用,而不用担心在这个值中会遗留某些初始化的痕迹。
下面我们以标准库代码包 bytes 中的结构体类型 Buffer 为例介绍以下:
bytes.Buffer
是一个尺寸可变的字节缓冲区。它的零值就是一个立即可用的空缓冲区。因此,调用表达式 new(bytes.Buffer)
的求值结果就是一个指向一个空缓冲区的指针值。然后,我们就可以立即在这个缓冲区上进行读写操作了。
标准库代码包 sync 中的结构体类型 Mutex 也是一个可以 new 后即用的数据类型。它的零值就是一个处于未锁定状态的互斥量。
内建函数 new 的这种特性为我们提供了一个关于自定义数据类型的可参考的设计规则:
例如,在我们自定义一个结构体类型的时候就要考虑到,在其中的每个字段的值都分别为对应类型的零值的时候,这个结构体值就应该已经处于可用的状态。这样,我们在 new 它的时候就能够得到一个立即可用的值的指针值,而不需要再做额外的初始化。
当然,在感觉一个类型的零值还无法让它变得可用的时候,我们可以使用相应的字面量来达到分配内存空间并初始化值的目的。
前面我们已经讲过,我们可以在字面量中灵活的指定新值中的每一个元素的值。但是要注意,字面量所代表的是该类型的值,而不是指向该类型值的指针值。 因此,我们在将它们与调用 new 函数的调用表达式做等价替换的时候,还需要在字面量的前面加入取址操作符 & 以表示指向该类型值的指针值。
2. 内建函数 make
与 new 不同的是,make 函数只能被用于创建 切片类型、字典类型 和 通道类型 的值,并返回一个已被初始化的(即非零值的)的对应类型的值。
那 make 函数为啥要这样做呢?
在之前的博文中我们介绍过,这 3 个复合类型都是引用类型。在它们的每一个值的内部都会保持着一个对某个底层数据结构值的引用。如果不对它们的值进行初始化,那么其中的这种引用关系是不会被建立起来的,同时相关的内部值也会不正确。在这种情况下,该类型的值也就不能够被使用,因为它们是不完整的,还处于未就绪的状态。这就意味着,在创建这 3 个引用类型的值的时候,必须将内存空间分配和数据初始化这两个步骤绑定在一起。也正是为了保证这些值的可用性,切片类型、字典类型 和 通道类型的零值都是 nil,不是那个未被初始化的值。因此,当我们 new 这 3 个引用类型并想创建它们的值的时候,得到的却是一个指向空值 nil 的指针值。
除此之外,内建函数 make 所接受的参数也与 new 函数有所不同。make 函数除了会接受一个表示目标类型的类型字面量之外,还会接受一个或两个额外的参数。
对于 切片类型 来说,我们可以在把新值的长度和容量也传递给 make 函数。例如:
// 调用表达式创建了一个新的 []int 类型的值,这个值的长度为10、容量为100
make([]int, 10, 100)
当然,我们也可以省略掉最后一个参数,即不指定新值的容量。这种情况下,该值的容量会与其长度一致。示例如下:
// 变量s的类型是[]int的,而长度和容量都是10。
s := make([]int,10)
在使用 make 函数初始化一个切片值的过程中,该值会引用一个长度与其容量相同且元素类型与其元素类型一致的数组值。这个数组值就是该切片值的底层数组。该数组值中的每个元素都是当前元素类型的零值。但是,切片值只会展现出数量与其长度相同的元素。因此,调用表达式 make([]int,10,100)
所创建并初始化的值就是 []int{0 0 0 0 0 0 0 0 0 0}
。
我们在使用 make 函数创建字典类型的值的时候,也可以指定其底层数据结构的长度。但是,该字典值只会展示出我们明确 “放入” 的键值对。例如:
// 调用如下表达式,所创建和初始化的值会是 map[string]int
make(map[string]int,100)
// 也可以忽略掉那个用于表示底层数据结构长度的参数
make(map[ string]int)
虽然我们也可以忽略掉那个用于表示底层数据结构长度的参数 ,但是还是建议:
应该在性能敏感的应用场景下,根据这个字典值可能包含的键值对的数量以及“放人” 它们的时间,仔细地设置该长度参数。
最后我们简单介绍以下对于 通道类型(Channel) 的值的数据初始化。到此目前为止,我们还没有对通道类型进行过任何说明。不过,在后续的博文中,我们会详细讲解这个特殊的引用类型。
// 使用make函数创建一个通道类型的值
make(chan int, 10)
其中的第一个参数表示的是 通道的类型,而第二个参数则表示该 通道的长度。与字典类型相同,第二个参数也可以被忽略掉。不过忽略它的含义却与针对字典类型的情况有着很大的不同,这些我们会在后面的博文中专门讲解。
注意: make 函数只能被应用在引用类型的值的创建上。并且,它的结果是第一个参数所代表的类型的值,而不是指向这个值的指针值。
如果我们想要获得该指针值的话,只能在调用 make 函数的表达式的求值结果之上应用取址操作符 &,像这样:
m := make(map[string]int, 100)
mp := &m
到目前为止,我们已经介绍了 3 种创建值的的方法:
- 使用 字面量
- 调用内建函数 new
- 调用内建函数 make
它们适用于不同的应用场景。当然,在某些应用场景中、我们可以有多种选择:
-
在创建一个切片类型的值的时候,我们既可以使用字面量也可以使用 make 函数。这种选择的结果往往取决于我们是否需要定制切片值中的某个或某些元素值。
-
如果我们能够保证一个结构体类型的值在其中字段的值均为零值的情况下就能够处于可用状态的话,那么仅使用 new 函数来初始化它与使用字面量进行初始化是基本等价的。不过要注意,这两种方法产生的结果的类型是不同的。
总结
- 字面量可以被用于初始化几乎所有的Go语言数据类型的值,除了接口类型和通道类型。接口类型没有值,而通道类型的值只能使用 make 函数来创建。如果需要指向值的指针值,那么可以在表示该值的字面量之上进行取址操作。
- 内建函数 new 主要被用于创建值类型的值。调用 new 函数的表达式的结果值将会是指向被创建值的指针值,并且被创建值会是其所属数据类型的零值。因此,new 函数不适合被用来创建引用类型的值。最直接的原因是引用类型的值的零值都是 nil,是不可用的。
- 内建函数 make 仅能被用于某些引用类型(切片类型、字典类型 和 通道类型)的值的创建。它在创建值之后还会对其进行必要的初始化。与 new 函数不同.调用 make 函数的表达式的结果值将会是被创建的值本身,而不是指向它的指针值。