二叉树学习笔记
基本概念
二叉树可以定义为节点的有限集合,这个集合或者为空集,或者由一个根及两棵不相交的分别称作这个根的左子树和右子树的二叉树组成。(二叉树的定义是一个递归定义),二叉树可以是空集合,此时的二叉树称为空二叉树;二叉树也可可以是只有一个节点的集合,这个节点只能是根;它的左子树和右子树均是空二叉树。(图片源自张乃孝$PPT$)
- 满二叉树:如果一棵二叉树的任何节点或者是树叶,或有两棵非空子树,则此二叉树称作满二叉树。
- 完全二叉树:如果一棵二叉树至多只有最下面的两层节点读书可以小于2,其余各层节点度数^节点分支数^都必须为2,并且最下面一层的节点都集中在该层最左边的若干位置上,则此二叉树称为完全二叉树。(完全二叉树不一定是满二叉树)
- 扩容二叉树:把原二叉树的节点都变为度数为2的分支节点,也就是说,如果原节点的度数为2,则不变;度数为1,则增加一个分支;度数为0,则增加两个分支。新增加的节点都用小方框表示,称为外部节点,树中原有的节点称为内部节点。特别地,对空二叉树扩容得到的扩容二叉树只有一个外部节点。
- 外部路径长度E:在扩容的二叉树中从根到每个外部节点的路径长度之和。内部路径长度I:在扩容的二叉树中从根到每个内部节点的路径长度之和。
主要性质
1、在二叉树的$i$层上至多有$2^i$个节点($i\ge 0$)
2、高度为$k$的二叉树中最多有$2^{k+1}-1$个节点($k \ge 0$)
3、对于任何一棵二叉树,如果叶节点个数为$n_{0}$,度^1为2的节点个数为$n_{2}$,则有:$n_{0}=n_{2}+1$。($n_{0}+n_{1}+n_{2}=n_{1}+2*n_{2}+1$)
4、具有$n$个节点的完全二叉树的深度$k$为$[log_{2}n]$。
5、对于具有$n$个节点的完全二叉树,如果按照从上(根节点)到下(叶节点)和从左到右的顺序对二叉树中的所有节点从0开始到$n-1$进行编号,则对于任意的下表为$i$的节点,有:
(1).如果$i=0$,则它是根节点,它没有父节点;如果$i\gt 0$,则它的父节点的下表为$[(i-1)/2]$;
(2).如果$2i+1 \le n-1$,则下标为$i$的节点的下标为$2i+1$;否则,下标为$i$的节点没有左子节点;
(3).如果$2i+2 \le n-1$,则下标为$i$的节点的右子节点的下标为$2i+2$;否则,下标$i$的节点没有右子节点。
6、在满二叉树中,叶节点的个数比分支节点个数多1。($n_{0}=n_{2}+1$)
7、在扩充二叉树中,外部节点个数比内部节点个数多1。
8、对任意扩充二叉树,外部路径长度$E$和内部路径长度$I$之间满足关系:$E=I+2n$,其中$n$是内部节点个数。
抽象数据结构
1 | ADT BinTree is |
二叉树的周游
二叉树的周游是指按某种方式访问二叉树中的所有节点,使每个节点被访问一次且只能被访问一次。
深度优先周游
若以符号$D$、$L$、$R$分别表示根节点、左子树、右子树,则二叉树的周游共有六种方式:$DLR$、$LDR$、$LRD$、$DRL$、$RDL$和$RLD$。如果限定先左后右,则只能采用前三种周游方式:
- $DLR$ <—-> 先根次序(简称先序或前序)周游
若二叉树不空,则先访问根;然后按先根次序周游左子树;最后按先根次序周游右子树。$eg$.下图二叉树先根次序周游得到的节点序列为:A、B、D、C、E、G、F、H、I。
- $LRD$ <—-> 后根次序(简称后序)周游
若二叉树不空,则先按后根次序周游左子树;然后按后根次序周游右子树;最后访问根。上图所示的二叉树,后根次序周游得到的节点序列为:D、B、G、E、H、I、F、C、A。
- $LDR$ <—-> 中根次序(简称中序或对称序)周游
若二叉树不空,则先按对称序周游左子树,然后访问根;最后按对称序周游右子树。前图所示的二叉树,按对称序周游一棵二叉树得到的节点序列为:D、B、A、E、G、C、H、F、I。
对于给定的二叉树,可以唯一确定它的先根序列、后根序列和对称序列。但是反过来,给定一个二叉树的任意一种周游的序列,无法唯一确定这个二叉树。如果已知一个二叉树的对称序列,又知道另外一种周游序列就可以唯一确定这个二叉树。
广度优先周游
若二叉树的高度为$h$,则从0到$h$逐层如下处理:从左到右逐个访问存在的节点。广度优先周游一棵二叉树所得到的节点序列,叫做这棵二叉树的层次序列。前图二叉树广度优先周游所得到的节点层次序列为:A、B、C、D、E、F、G、H、I。
$eg$.对下图二叉树进行先根、后根和中根周游所得到的线性序列分别为:
图片 | 结果 |
---|---|
上述结果分别被称为表达式的前缀表达式、后缀表达式和中缀表达式。
周游的抽象算法
递归算法
- 先根次序周游
1 | void preOrder(BinTree t){ |
- 对称序周游
1 | void inOrder(BinTree t){ |
- 后根次序周游
1 | void postOrder(BinTree t){ |
非递归算法
- 先根次序周游
- 把根节点压入栈中;2、从栈顶中取出元素(包括退栈),只要取出元素非空,就访问该节点;3、顺序将其右子节点和左子节点进栈。重复执行2、3,直到当从栈顶中取出的元素(包括退栈)为空,并且栈也为空时,周游结束。
算法时间代价:假设栈的主要操作只要常量时间,算法中每个二叉树恰好进栈、出栈各一次,所以它的时间代价为$O(n)$,其中$n$为二叉树中子二叉树(也是节点)的个数。
1 | void nPreOrder(BinTree t){ |
- 对称序周游
1、若当前二叉树不为空时,则沿其左子树尽量前进,在前进过程中,把所经过的二叉树逐个压入栈中,知道左子树为空。
2、弹出栈顶元素为当前二叉树,并访问该二叉树的根;
3、如果当前二叉树有右子树,再进入它的右子树(作为当前二叉树),从1开始执行上述过程;
4、如果当前二叉树没有右子树,但是栈不空,转2。
重复上述过程,直到当前二叉树没有右子树并且栈也为空时,周游结束。
算法时间代价:假设栈的主要操作只要常量时间,算法中每个二叉树恰好进栈、出栈各一次,所以它的时间代价为$O(n)$,其中$n$为二叉树中子二叉树(也是节点)的个数。(外表看上去是一个双重循环,但时间代价还是线性的)。
1 | void nInOrder(BinTree t){ |
- 后根次序周游
1、首先由该二叉树找到其左子树,周游其左子树,周游完返回到这个二叉树的根;
2、然后由该二叉树找到其右子树,周游其右子树,周游完再次返回到这个二叉树的根;
3、最后才能访问该二叉树的根结点。
为此必须在算法中增加对二叉树出栈的判断: 如果是从栈顶二叉树的左子树回来,就直接进入右子树周游;如果是从栈顶二叉树的右子树回来,就执行出栈,访问该二叉树的根结点。(时间代价仍为$O(n)$)。
1 | void nPostOrder(BinTree t){ |
- 广度优先周游
首先把二叉树送入队列;其后,每当从队首取出一个二叉树访问根之后,马上把它的子二叉树按从左到右的次序送入队列尾端;重复此过程直到队列为空。
算法代价:每个二叉树进队列一次出队列一次,所需时间代价为$O(n)$。主要空间代价时需要队列的附加空间。若二叉树节点个数为$n$,最坏的情况出现再完全二叉树时,需要大约$n/2$个队列元素的空间。
1 | void levelOrder(BinTree t){ |
二叉树的实现
顺序表示
采用一组连续的存储单元来存放二叉树中的节点
对于完全二叉树,按照从上(根节点)到下(叶节点)和从左到右的顺序,对二叉树中的所有节点从0到$n-1$编号,这样存放到一维数组中,只要通过数组元素的下标关系,就可以确定二叉树中节点之间的逻辑关系。
对于一般的二叉树,采用顺序表示,首先要对它进行扩充,增加一些并不存在的空节点,使之成为一棵完全二叉树,然后再用一维数组顺序存储。
定义
1 | struct SeqBinTree{ /*顺序二叉树类型定义*/ |
运算实现
1 | /*返回下标为p的节点的父节点的下标*/ |
链接表示
二叉树中的每个节点对应链表中的一个节点,每个节点中,除了存储节点本身的数据外,再设置两个指针字段:llink和rlink,分别存储节点的左子节点和右子节点的位置。当节点的某个子树为空时,则相应的指针为空指针。这种表示方法称为左-右指针表示法。
定义
1 | struct BinTreeNode; /*二叉树中节点*/ |
运算实现
1 | /*返回节点p的左子节点的地址*/ |
线索二叉树
线索二叉树是对于左-右指针表示法的一种修改,它利用节点的空左指针($llink$)存储该节点再某种周游序列中的前驱节点的位置;利用节点的空右指针($rlink$)存储该节点在同种周游序列中的后继节点的位置。这种附加的指向前驱节点和后继节点的指针称作线索,加进了线索的二叉树左-右指针表示称作线索二叉树。
为区分左右指针和线索,需要在每个节点里增加两个标志位$ltag$,和$rtag$。
增加了标志域的节点结构为:
线索二叉树示例:
线索二叉树定义
1 | struct ThrTreeNode; /*线索二叉树中的节点*/ |
按对称序线索化二叉树
在未线索化之前,所有结点的$llink$和$rlink$ 都是指向子结点指针,因此所有$ltag$和$rtag$ 的初始状态都为0。给出一棵二叉树,要 将它按对称序线索化,其做法就是按对称 序周游此二叉树,在周游的过程中用线索 代替空指针。
1 | void thread(ThrTree t){ |
按对称序周游对称序线索二叉树
要按对称序周游对称序线索二叉树,首先找到对称序列 中的第一个结点,然后依次找到结点的后继结点,直至其后继结点为空即可。
第一个结点很容易找,只要从根结点出发沿着左指针不断往下走,直至左指针为空,到达“最左下”的结点, 这就是对称序第一个结点。
找任意结点的对称序后继时,也非常容易做:一个结点的右指针字段如果是线索,则它就指向该结点在对称序 下的后继;如果不是线索,则它指向该结点右子树的根, 而该结点在对称序下的后继应是此右子树的最左下结点。
1 | void nInOrder(ThrTree t){ |