王道数据结构5.2(树的应用)

阅读: 评论:0

王道数据结构5.2(树的应用)

王道数据结构5.2(树的应用)

树的应用

  • 一、二叉排序树
    • (一) 基础
    • (二) 操作
      • 1. 二叉排序树的查找
      • 2. 二叉排序树的插入
      • 3. 二叉排序树的构造
      • 4. 二叉排序树的删除
      • 5. 查找效率分析
  • 二、平衡二叉树
    • (一)定义
    • (二)操作
      • 1. 二叉平衡树的插入
  • 三、哈夫曼树
    • 1. 带权路径长度
    • 2.哈夫曼树的构造
    • 3. 哈夫曼编码

一、二叉排序树

(一) 基础

  1. 定义:又称为二叉查找树,一棵二叉树或空二叉树,或者具有如下性质的二叉树:
    ① 左子树上所有结点的关键字均小于根结点的关键字。
    ② 右子树上所有结点的关键字均大于根结点的关键字。
    ③ 左右子树又各是一棵二叉排序树。
  2. 利用中序遍历,可以得到一个递增的有序序列。

(二) 操作

1. 二叉排序树的查找

(1)思想:
若树非空,目标值与根结点的值比较:
①若相等,则查找成功。
②若小于根结点,则查找左子树,若大于根结点,则查找右子树
查找成功则返回节点指针,查找失败,则返回NULL。
(2)代码:

//二叉排序树结点 
typedef struct BSTNode{int key;struct BSTNode *lchild,*rchild;
}BSTNode,*BSTree;
//在二叉排序树中查找值为key的结点(非递归)
BSTNode *BST_Search(BSTNode T,int key){while(T!=NULL&&key!=T->key){if(key<T->key)T=T->lchild;else T=T->rchild;}return T;
}
//在二叉排序树中查找值为key的结点(递归)
BSTNode *BSTSearch(BSTree T,int key){if(T==NULL)returm NULL;if(key==T->key)return T;else if(key==T->key)return BSTSearch(T->lchild,key);elsereturn BSTSearch(T->rchild,key);
}
  1. 分析:
    ① 非递归算法时间复杂度为O(1)
    ② 最坏时间复杂度为O(h)

2. 二叉排序树的插入

  1. 思想:若原二叉排序树为空,则直接插入结点,否则,若关键字k小于根结点值,则插入左子树,若关键字k大于根结点,则插入到右子树。
  2. 代码:
//在二叉排序树插入关键字k的新结点(递归实现)
int BST_Insert(BSTree &T,int k){if(T==NULL){T=(BSTree)malloc(sizeof(BSTNode));T->key=k;T->lchild=T->rchild=NULL;return 1;}else if(k==T->key)return 0;else if(k<T->key)return BST_Insert(T->lchild,k);else return BST_Insert(T->rchild,k);
}

3. 二叉排序树的构造

  1. 代码:
//按照str[]中的关键字序列建立二叉排序树
void Creat_BST(BSTree &T,int str[],int n){T=NULL;int i=0;while(i<n){BST_Insert(T,str[i]);i++;}
}
//插入结点
int BST_Insert(BSTree &T,int k){if(T==NULL){T=(BSTree)malloc(sizeof(BSTNode));T->key=k;T->lchild=T->rchild=NULL;return 1;}else if(k==T->key)return 0;else if(k<T->key)return BST_Insert(T->lchild,k);else return BST_Insert(T->rchild,k);
}
  1. 分析:
    不同的str[]序列可能得到同款二叉排序树,也可能得到不同的二叉排序树。
  2. 实例

4. 二叉排序树的删除

  1. 思想:
    (1) 先搜索找到目标节点:
    ① 如果被删除节点是叶子结点,则直接删除,不会破坏二叉排序树的性质
    ② 若z结点只有一棵左子树或右子树,则让z的子树成为z父节点的子树,代替z的位置。
    ③ 若z结点存在左右子树,则令z的直接后继(或直接前驱)代替z,然后从二叉排序树中山区这个直接后继(或直接前驱),这样就转换成了①或②情况。【z的后继:z的右子树中最左下结点,该结点一定没有左子树;z的前驱:z的左子树中最右下结点,该结点一定没有右子树】

5. 查找效率分析

  1. 查找长度—在查找算法中,需要对比关键字的次数称为查找长度,反映了查找操作时间复杂度。
  2. 若树高h,为了找到最下层的结点需要对比h次。
  3. 最好情况:n个结点的二叉树最小高度为log2n+1【向下取整】
  4. 最坏情况:每个结点只有一个分支,树高h=节点数n,平均查找长度=O(n)
  5. 实例
    ① 查找成功的平均查找时间

    查找失败的平均查找长度ASL

二、平衡二叉树

(一)定义

  1. 简称平衡树(AVL树)—书上任意结点的左子树和右子树的高度之差不超过1。【G.M.Adelson-Velsky和E.M.Landis】
  2. 结点的平衡因子=左子树高-右子树高。
  3. 平衡二叉树结点的平衡因子的值只可能是-1,0或1。只要有任意一点平衡因子绝对值大于1,则不是平衡二叉树。
  4. 构造结构
//二叉排序树结点 
typedef struct AVLNode{int key;int balance;//平衡因子struct AVLNode *lchild,*rchild;
}AVLNode,*AVLTree;

(二)操作

1. 二叉平衡树的插入

(1)最小不平衡子树:从插入点往回找到第一个不平衡节点,调整以该结点的根的子树。
(2)插入后查找路径上的所有结点的平衡因子都会发生变化。
(3)寻找最小不平衡子树

(4)只需要将最小不平衡子树调整平衡,其他祖先结点都会恢复平衡。
(5)调整不平衡子树
① LL(在A的左孩子的左子树中插入导致不平衡)
右单旋转:由于在结点A的左孩子的左子树上插入了新结点,A的平衡因子从1增至2,导致以A上为根的子树失去平衡,需要一次向右的旋转操作。将A的左孩子B向右上旋转代替A成为根结点,将A结点向右下旋转成为B的右子树的根结点,而B的原右子树则作为A结点的左子树。

RR(在A的右孩子的右子树中插入导致不平衡)
左单旋转:由于在结点A的右孩子的右子树上插入了新结点,A的平衡因子从-1增至-2,导致以A上为根的子树失去平衡,需要一次向左的旋转操作。将A的右孩子B向左上旋转代替A成为根结点,将A结点向左下旋转成为B的左子树的根结点,而B的原左子树则作为A结点的右子树。

LR(在A的左孩子的右子树中插入导致不平衡)
先左旋后右旋:由于在A的左孩子L的右子树R上插入新结点,A的平衡因子由1增至2,导致以A为根的子树失去平衡,需要进行两次旋转操作,先左旋后右旋。先将A结点的左孩子B的右子树的根结点C向左上旋转提升到B结点的位置,然后再把该C结点向右上旋转提升到A结点的位置。

RL(在A的右孩子的左子树中插入导致不平衡)
先右后左旋转
由于在A的右孩子L的左子树R上插入新结点,A的平衡因子由-1增至-2,导致以A为根的子树失去平衡,需要进行两次旋转操作,先右旋后左旋。先将A结点的右孩子B的左子树的根结点C向右上旋转提升到B结点的位置,然后再把该C结点向左上旋转提升到A结点的位置。
(6)代码

  • 实现f向右下旋转,p向右上旋转:其中f是父节点,p为左孩子,gf为f的父节点
  f->lchild=p->rchild;p->rchild=f;gf->lchild/rchild = p;
  • 实现f向左下旋转,p向左上旋转:其中f是父节点,p为右孩子,gf为f的父节点
  f->rchild=p->lchild;p->lchild=f;gf->lchild/rchild = p;
  1. 查找效率分析
    (1)若树高为h,则最坏情况下,查找一个关键字最多需要对比h次,即查找操作的时间复杂度不可能超过O(h)。
    (2)平衡二叉树——树上任意结点的左子树和右子树的高度之差不超过1。
    (3)假设以nh表示深度为h的平衡树中含有最少节点数。则有n0=0,n1=1,n2=2,并且有nh=nh-1+nh-2+1。【n3=4,n4=7,n5=12,n=9,则说明高最大为4】
    可以证明含有n个结点的平衡二叉树的最大深度为O(log2n),平衡二叉树的平均查找长度为O(log2n)。

三、哈夫曼树

1. 带权路径长度

(1)结点的权:有某种现实含有的数值(如:表示结点的重要性等)
(2)结点的带权路径长度:从树的根到该结点的路径长度(经过的边数)与该结点上权值的乘积。
(3)树的带权路径长度:树中所有叶结点的带权路径长度之和wpl
(4)在含有n个带权也结点的二叉树中,其中带权路径长度最小的二叉树称为哈夫曼树,也称最优二叉树。

2.哈夫曼树的构造

(1)给定n个权值分别为w1, w2,…, wn的结点,构造哈夫曼树的算法描述如下:
1)将这n个结点分别作为n棵仅含一个结点的二叉树,构成森林F。
2)构造一个新结点,从F中选取两棵根结点权值最小的树作为新结点的左、右子树,并且将新
结点的权值置为左、右子树上根结点的权值之和。
3)从F中删除刚才选出的两棵树,同时将新得到的树加入F中。
4)重复步骤2)和3),直至F中只剩下一棵树为止。

(2)规律:

  • 每个初始结点最终都成为叶结点,且权值越小的结点到根结点的路径长度越大
  • 哈夫曼树的结点总数为2n − 1
  • 哈夫曼树中不存在度为1的结点。
  • 哈夫曼树并不唯一,但WPL必然相同且为最优

3. 哈夫曼编码

100个选择题的答案
(1)固定长度编码——每个字符用相等长度的二进制位表

  • ASCII编码
    A——0100 0001
    B——0100 0010
    C——0100 0011
    D——0100 0100
    8*100=800
  • 每个字符用长度为2的二进制表示
    假设,100题中有80题选C,10题选A,8题选B,2题选D
    所有答案的二进制长度=802+102+82+22=200 bit
    (2)可变长度编码——允许对不同字符用不等长的二进制位表示
    若没有一个编码是另一个编码的前缀,则称这样的编码为前缀编码

    (3)有哈夫曼树得到哈夫曼编码——字符集中的每个字符作为一个叶子结点,各个字符出现的频度作为结点的权值,根据之前介绍的方法构造哈夫曼树.
    (4)注意:
    ① 哈夫曼树不唯一,因此哈夫曼编码不唯一。
    ② 哈夫曼编码可用于数据压缩。

本文发布于:2024-01-29 17:47:20,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170652164717197.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据结构   王道
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23