树与树算法

树的概念

树(英语:tree)是一种抽象数据类型(ADT)或是实作这种抽象数据类型的数据结构,用来模拟具有树状结构性质的数据集合。它是由n(n>=1)个有限节点组成一个具有层次关系的集合。把它叫做“树”是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。它具有以下的特点:

  • 每个节点有零个或多个子节点;
  • 没有父节点的节点称为根节点;
  • 每一个非根节点有且只有一个父节点;
  • 除了根节点外,每个子节点可以分为多个不相交的子树;

比如说:
tree Treedatastructure

树的术语

  • 节点的度:一个节点含有的子树的个数称为该节点的度;
  • 树的度:一棵树中,最大的节点的度称为树的度;
  • 叶节点终端节点:度为零的节点;
  • 父亲节点父节点:若一个节点含有子节点,则这个节点称为其子节点的父节点;
  • 孩子节点或子节点:一个节点含有的子树的根节点称为该节点的子节点;
  • 兄弟节点:具有相同父节点的节点互称为兄弟节点;
  • 节点的层次:从根开始定义起,根为第1层,根的子节点为第2层,以此类推;
  • 树的高度深度:树中节点的最大层次;
  • 堂兄弟节点:父节点在同一层的节点互为堂兄弟;
  • 节点的祖先:从根到该节点所经分支上的所有节点;
  • 子孙:以某节点为根的子树中任一节点都称为该节点的子孙。
  • 森林:由m(m>=0)棵互不相交的树的集合称为森林;

树的种类

  • 无序树:树中任意节点的子节点之间没有顺序关系,这种树称为无序树,也称为自由树;

  • 有序树

    :树中任意节点的子节点之间有顺序关系,这种树称为有序树;

    • 二叉树

      :每个节点最多含有两个子树的树称为二叉树;

      • 完全二叉树:对于一颗二叉树,假设其深度为d(d>1)。除了第d层外,其它各层的节点数目均已达最大值,且第d层所有节点从左向右连续地紧密排列,这样的二叉树被称为完全二叉树,其中满二叉树的定义是所有叶节点都在最底层的完全二叉树;
      • 平衡二叉树(AVL树):当且仅当任何节点的两棵子树的高度差不大于1的二叉树;
      • 排序二叉树(二叉查找树(英语:Binary Search Tree),也称二叉搜索树、有序二叉树);(对于任何节点所有左边值都比右边小)
    • 霍夫曼树(用于信息编码):带权路径最短的二叉树称为哈夫曼树或最优二叉树;

    • B树:一种对读写操作进行优化的自平衡的二叉查找树,能够保持数据有序,拥有多余两个子树。

树的存储与表示

顺序存储:将数据结构存储在固定的数组中,然在遍历速度上有一定的优势,但因所占空间比较大,是非主流二叉树。二叉树通常以链式存储。

树的顺序存储

链式存储:

树的链式存储

由于对节点的个数无法掌握,常见树的存储表示都转换成二叉树进行处理,子节点个数最多为2

常见的一些树的应用场景

1.xml,html等,那么编写这些东西的解析器的时候,不可避免用到树
2.路由协议就是使用了树的算法
3.mysql数据库索引
4.文件系统的目录结构
5.所以很多经典的AI算法其实都是树搜索,此外机器学习中的decision tree也是树结构

网页结构

二叉树

二叉树的基本概念

二叉树是每个节点最多有两个子树的树结构。通常子树被称作“左子树”(left subtree)和“右子树”(right subtree)

二叉树的性质(特性)

性质1: 在二叉树的第i层上至多有2^(i-1)个结点(i>0)
性质2: 深度为k的二叉树至多有2^k - 1个结点(k>0)
性质3: 对于任意一棵二叉树,如果其叶结点数为N0,而度数为2的结点总数为N2,则N0=N2+1;
性质4:具有n个结点的完全二叉树的深度必为 log2(n+1)
性质5:对完全二叉树,若从上至下、从左至右编号,则编号为i 的结点,其左孩子编号必为2i,其右孩子编号必为2i+1;其双亲的编号必为i/2(i=1 时为根,除外)

(1)完全二叉树——若设二叉树的高度为h,除第 h 层外,其它各层 (1~h-1) 的结点数都达到最大个数,第h层有叶子结点,并且叶子结点都是从左到右依次排布,这就是完全二叉树。
完全二叉树

(2)满二叉树——除了叶结点外每一个结点都有左右子叶且叶子结点都处在最底层的二叉树。
满二叉树

二叉树的节点表示以及树的创建

通过使用Node类中定义三个属性,分别为elem本身的值,还有lchild左孩子和rchild右孩子

1
2
3
4
5
6
class Node(object):
"""节点类"""
def __init__(self, elem=-1, lchild=None, rchild=None):
self.elem = elem
self.lchild = lchild
self.rchild = rchild

树的创建,创建一个树的类,并给一个root根节点,一开始为空,随后添加节点

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
class Tree(object):
"""树类"""
def __init__(self, root=None):
self.root = root

def add(self, elem):
"""为树添加节点"""
node = Node(elem)
#如果树是空的,则对根节点赋值
if self.root == None:
self.root = node
else:
queue = []
queue.append(self.root)
#对已有的节点进行层次遍历
while queue:
#弹出队列的第一个元素
cur = queue.pop(0)
if cur.lchild == None:
cur.lchild = node
return
elif cur.rchild == None:
cur.rchild = node
return
else:
#如果左右子树都不为空,加入队列继续判断
queue.append(cur.lchild)
queue.append(cur.rchild)

二叉树的遍历

树的遍历是树的一种重要的运算。所谓遍历是指对树中所有结点的信息的访问,即依次对树中每个结点访问一次且仅访问一次,我们把这种对所有节点的访问称为遍历(traversal)。那么树的两种重要的遍历模式是深度优先遍历和广度优先遍历,深度优先一般用递归,广度优先一般用队列。一般情况下能用递归实现的算法大部分也能用堆栈来实现。

深度优先遍历

对于一颗二叉树,深度优先搜索(Depth First Search)是沿着树的深度遍历树的节点,尽可能深的搜索树的分支。
那么深度遍历有重要的三种方法。这三种方式常被用于访问树的节点,它们之间的不同在于访问每个节点的次序不同。这三种遍历分别叫做先序遍历(preorder),中序遍历(inorder)和后序遍历(postorder)。我们来给出它们的详细定义,然后举例看看它们的应用。

  • 先序遍历 在先序遍历中,我们先访问根节点,然后递归使用先序遍历访问左子树,再递归使用先序遍历访问右子树(即先根,永远根据根来说)

    根节点->左子树->右子树

    1
    2
    3
    4
    5
    6
    7
    def preorder(self, root):
    """递归实现先序遍历"""
    if root == None:
    return
    print root.elem
    self.preorder(root.lchild)
    self.preorder(root.rchild)
  • 中序遍历 在中序遍历中,我们递归使用中序遍历访问左子树,然后访问根节点,最后再递归使用中序遍历访问右子树

    左子树->根节点->右子树

    1
    2
    3
    4
    5
    6
    7
    def inorder(self, root):
    """递归实现中序遍历"""
    if root == None:
    return
    self.inorder(root.lchild)
    print root.elem
    self.inorder(root.rchild)
  • 后序遍历 在后序遍历中,我们先递归使用后序遍历访问左子树和右子树,最后访问根节点

    左子树->右子树->根节点

    1
    2
    3
    4
    5
    6
    7
    def postorder(self, root):
    """递归实现后续遍历"""
    if root == None:
    return
    self.postorder(root.lchild)
    self.postorder(root.rchild)
    print root.elem

课堂练习: 按照如图树的结构写出三种遍历的顺序:
树练习
结果:
先序:a b c d e f g h
中序:b d c e a f h g
后序:d e c b h g f a
思考:哪两种遍历方式能够唯一的确定一颗树???—>只有两种遍历方式中包含中序遍历后才能把整棵树画出来,如果没有中序,左右节点分不开,永远连在一起。

对以上树结构结合先序和中序进行进行树结构的推导:

已知先序排列(根左右):a b c d e f g h

中序排列(左根右):b d c e a f h g

1.根据先序排列,得到树的根节点—>a

2.已知树的根节点a,根据中序排列可以分出根节点下的左右子树:左子树[b d c e] 右子树[f h g]

3.先对a节点的左子树[b d c e]进行处理,根据先序排列,确定左子树的根节点—>b(先序排列[b c d e]属于左子树的元素,且先序排列是根节点在前,所以b是根节点);

4.再根据中序遍历(左根右)[b d c e]得到左子树的子树只有右子树(因为左子树中序排列左根右,的根节点b左边没有元素,只有右边有,所以b节点是只有右子树),b节点的右子树元素为[d c e];

5.b节点右子树元素有[d c e],再根据先序遍历(根左右)[c d e],得到b节点右子树的根节点为c;

6.再结合中序遍历(左根右),根节点c的左右两节点为d(左)和e(右);

以上就是左子树的推导,接下来是右子树;

1.已知右子树元素有[f h g],再根据先序遍历(根左右)结合右子树的元素有[f g h],可知右子树的根节点为—>f;

2.已知右子树节点f,根据中序遍历(左根右)可知[f h g],右子树根节点f只有右子树,元素为[h g];

3.再根据右子树元素[h g]结合先序遍历(根左右)[g h],f的右子树的根节点为g,再结合先序排列和中序排列中h的位置可知,g的左节点是h;

广度优先遍历(层次遍历)

从树的root开始,从上到下从从左到右遍历整个树的节点。

二叉树

以上图为案例来说明广度遍历的做法:

  1. 首先从根节点[A]开始遍历,先看A是否有左子树,有的话将左子树节点添加进来-》[A B],再看A的右子树是否存在,有的话添加进来->[A B C];
  2. 这时A的子树遍历完成,开始从B开始遍历其子树。看看B的左子树存在否,如果存在添加进来->[A B C D],同理如果右子树存在则继续添加->[A B C D E],此时已经遍历完B节点,接着遍历C节点;
  3. 同上面的过程一样,C节点遍历完后可以得到->[A B C D E F G];
  4. 重复1、2、3的步骤一直遍历,直到遍历完整颗树;
  5. 观察遍历过程,可以发现,是从[]的左边依次完右边处理,即左边的遍历完后往右边遍历(左边的节点可以理解为出队),遍历到的节点从[]的右边进入[],抽象理解就是从一端进来,一端出去,先进先出,这不就是队列数据结构吗?
1
2
3
4
5
6
7
8
9
10
11
12
13
def breadth_travel(self, root):
"""利用队列实现树的层次遍历"""
if root == None:
return
queue = []
queue.append(root)
while queue:
node = queue.pop(0)
print node.elem,
if node.lchild != None:
queue.append(node.lchild)
if node.rchild != None:
queue.append(node.rchild)

完整的二叉树实现代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Date : 2021-04-01 20:21:53
# @Author : Jabari (innocenfox@gmail.com)
# @Link : http://www.everweekup.com
# @Version : $1.0$


# 树是链表的扩充
# 针对链表来说,只有一个后继区域,而二叉树有两个后继节点连接

from Queue import Queue

class Node(object):
""" """
def __init__(self, item):
self.elem = item
self.lchild = None
self.rchild = None

class Tree(object):
"""二叉树"""
def __init__(self):
self.root = None

def add(self, item):
# 广度优先遍历
"""往完全二叉树的方向去添加节点"""
node = Node(item)
if self.root is None:
self.root = node
return

queue = Queue()
queue.add(self.root)

# 只要队列不为空,即还有节点,就能继续进行判断
while queue.show_queue():
cur_node = queue.delete()
if cur_node.lchild is None:
cur_node.lchild = node
return
else:
queue.add(cur_node.lchild)
if cur_node.rchild is None:
cur_node.rchild = node
return
else:
queue.add(cur_node.rchild)


def breadth_travel(self):
"""广度遍历"""
if self.root is None:
return

queue = Queue()
queue.add(self.root)

while queue.show_queue():
cur_node = queue.delete()
print(cur_node.elem, end=" ")
if cur_node.lchild is not None:
queue.add(cur_node.lchild)

if cur_node.rchild is not None:
queue.add(cur_node.rchild)

def pre_order(self, node):
"""先序遍历--递归
每次调用的时候都调用自身根
"""
if node is None:
return
print(node.elem, end=" ")

self.pre_order(node.lchild)
self.pre_order(node.rchild)

def in_order(self, node):
"""中序遍历"""

if node is None:
return

self.in_order(node.lchild)
print(node.elem, end=" ") # 左、根、右


self.in_order(node.rchild)

def postorder(self, node):
"""后序遍历"""

if node is None:
return

self.postorder(node.lchild)
self.postorder(node.rchild)
print(node.elem, end=" ")








if __name__ == '__main__':
tree = Tree()
tree.add(0)
tree.add(1)
tree.add(2)
tree.add(3)
tree.add(4)
tree.add(5)
tree.add(6)
tree.add(7)
tree.add(8)
tree.add(9)

tree.breadth_travel()
print(" ")
tree.pre_order(tree.root)
print(" ")
tree.in_order(tree.root)
print(" ")
tree.postorder(tree.root)

引用的队列数据结构代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
# encoding:utf-8
# DataStructure: Queue
# Author: Jabari
# Date: 2021-03-28
# 队列是一个顺序结构,元素从队列头部进入,从尾部删除,先进先出;

class Queue():

def __init__(self):
self.__list = []

def is_empty(self):
if len(self.__list):
return True
return False

return False

def add(self, item):
self.__list.append(item)


def delete(self):
return self.__list.pop(0)


def show_queue(self):
# print(self.__list)
return self.__list