二叉树数组表示
在链表表示下,二叉树的存储单元为节点TreeNode
,节点之间通过指针相连接。同前面的队列或栈,二叉树同样可以使用数组来表示。
表示完美二叉树
给定一棵完美二叉树,我们将所有节点按照层序遍历的顺序存储在一个数组中,则每个节点都对应唯一的数组索引。
按照层序遍历的特性,我们可以推导处父节点索引与子节点索引之间的“映射公式”:若某节点的索引为i,则该节点的左子节点索引为 2i+1,右子节点索引为 2i+2 。如图展示了各个节点索引之间的映射关系。
**映射公式的角色相当于链表中的节点引用(指针)。给定数组中的任意一个节点,我们都可以通过映射公式来访问它的左(右)子节点。
表示任意二叉树
完美二叉树是一个特例,在二叉树的中间层通常存在许多None
。由于层序遍历序列并不包含这些None
,因此我们无法仅凭借该序列来推测None
的数量和分布位置。这意味着存在多种二叉树结构都符合该层序遍历序列。
如图所示,给定一棵非完美二叉树,上述数组表示方法已经失效。
为解决此问题,我们可以考虑在层序遍历序列中显式地写出所有None
。这样处理后,层序遍历序列就可以表示唯一的二叉树了。
/* 二叉树的数组表示 */
// 使用 int 最大值 INT_MAX 标记空位
vector<int> tree = { 1, 2, 3, 4, INT_MAX, 6, 7, 8, 9, INT_MAX, INT_MAX, 12, INT_MAX, INT_MAX, 15 };
值得说明的是,完全二叉树非常适合使用数组来表示。回顾完全二叉树的定义,None
只出现在最底层且 靠右的位置,因此所有None
一定出现在层序遍历序列的末尾。
使用数组表示完全二叉树时,可以省略存储所有None
,非常方便。
以下代码实现了一棵基于数组表示的二叉树,包括以下几种操作。
- 给定某节点,获取它的值,左(右)子节点,父节点。
- 获取前序遍历、中序遍历、后序遍历、层序遍历序列。
/*数组表示下的二叉树类*/
class ArrayBinaryTree{
public:
/*构造方法*/
ArrayBinaryTree(vector<int> arr){
tree = arr;
}
/*列表容量*/
int size(){
return tree.size();
}
/*获取索引为i节点的值*/
int val(int i){
// 若索引越界,则返回 INT_MAX,代表空位
if (i < 0 || i >= size())
return INT_MAX;
return tree[i];
}
/*获取索引为i节点的左子结点的索引*/
int left(int i){
return 2 * i + 1;
}
/*获取索引为i节点的右子节点的索引*/
int right(int i){
return 2 * i + 2;
}
/*获取索引为i节点的父节点的索引*/
int parent(int i){
return (i - 1) / 2;
}
/*层序遍历*/
vector<int> levelOrder(){
vector<int> vec;
for (int num : tree){
if (num != INT_MAX)
vec.push_back(num);
}
return vec;
}
/*前序遍历*/
vector<int> preOrder(){
vector<int> vec;
dfs(0, "pre", vec);
return vec;
}
/*中序遍历*/
vector<int> inOrder(){
vector<int> vec;
dfs(0, "in", vec);
return vec;
}
/*后序遍历*/
vector<int> postOrder(){
vector<int> vec;
dfs(0, "post", vec);
return vec;
}
private:
vector<int> tree;
/*深度优先遍历*/
void dfs(int i, string order, vector<int> &res){
if (val(i) == INT_MAX){
return;
}
if (order == "pre"){
res.push_back(val(i));
}
dfs(left(i), order, res);
if (order == "in"){
res.push_back(val(i));
}
dfs(right(i), order, res);
if (order == "post"){
res.push_back(val(i));
}
}
};
优点与局限性
二叉树的数组表示有如下优点:
- 数组存储在连续的内存空间中,对缓存友好,访问与遍历速度较快。
- 不需要存储指针,比较节省空间。
- 允许随机访问节点。
数组也存在一些局限性:
- 数组存储需要连续内存空间,因此不适合存储数据量过大的树。
- 增删节点需要通过数组插入与删除操作实现,效率较低。
- 当二叉树中存在大量
None
时,数组中包含的节点数据比重低,空间利用率低。