复习-JavaGuide-Data-Structure

转载自https://github.com/Snailclimb/JavaGuide(添加小部分笔记)感谢作者!

  • 树是一种类似现实生活中的树的数据结构(倒置的树

  • 任何一颗非空树只有一个根节点

  • 一棵树具有以下特点:

    1. 一棵树中的任何两个节点有且仅有唯一的一条路相通 (因为每个结点只会有一个父节点)
    2. 一棵树如果有n个节点,那么它一定恰好有n-1条边
    3. 一棵树不包括回路
  • 下面是一颗二叉树 ly-20241212141852140 深度和高度是对应的;根节点所在层为1层

  • 常用概念

    1. 节点:树中每个元素都可以统称为节点

    2. 根节点:顶层节点,或者说没有父节点的节点。上图中A节点就是根节点

    3. 父节点:若一个节点含有子节点,则这个节点称为其子节点的父节点。上图中的 B 节点是 D 节点、E 节点的父节点

    4. 兄弟节点:具有相同父节点的节点互称为兄弟节点。上图中 D 节点、E 节点的共同父节点是 B 节点,故 D 和 E 为兄弟节点。

    5. 叶子节点:没有子节点的节点。上图中的 D、F、H、I 都是叶子节点

    6. 节点的高度**(跟叶子节点有关,同一层不一定一样)该节点到叶子节点最长路径所包含的边数

    7. 节点的深度**(跟根节点有关,同一层是一样的)根节点到该节点的路径所包含的边数**

    8. 节点的层数:节点的深度+1

    9. 树的高度:根节点的高度

二叉树的分类 #

  • **二叉树(Binary tree)**是每个节点最多只有两个分支(即不存在分支度大于2的节点)的树结构
  • 二叉树的分支,通常被称为左子树右子树,并且,二叉树的分支具有左右次序,不能随意颠倒
  • 二叉树的第i层至多拥有2^(i-1) 个节点
    深度为k的二叉树至多总共有 2^(k+1) -1 个节点 (深度为k,最多k + 1 层,最多为满二叉树的情况)
    至少有2^(k) 个节点,即 深度为k-1的二叉树的最多的节点再加1

(关于节点的深度的定义国内争议比较多,我个人比较认可维基百科对 节点深度的定义open in new window)。 ly-20241212141852434

满二叉树 #

一个二叉树,如果每一个的结点数都达到最大值,则这个二叉树就是 满二叉树。也就是说,如果一个二叉树的层数为 K,且结点总数是(2^k) -1 ,则它就是 满二叉树ly-20241212141852640

...

转载自https://github.com/Snailclimb/JavaGuide(添加小部分笔记)感谢作者!

什么是堆 #

  • 堆是满足以下条件的树 堆中每一个节点值都大于等于(或小于等于)子树中所有节点。或者说,任意一个节点的值**都大于等于(或小于等于)**所有子节点的值

    大家可以把堆(最大堆)理解为一个公司,这个公司很公平,谁能力强谁就当老大,不存在弱的人当老大,老大手底下的人一定不会比他强。这样有助于理解后续堆的操作。

    • 堆不一定是完全二叉树,为了方便存储索引,我们通常用完全二叉树的形式来表示堆
      广为人知的斐波那契堆二项堆就不是完全二叉树,它们甚至都不是二叉树
    • (二叉)堆是一个数组,它可以被看成是一个近似的完全二叉树
  • 下面给出的图是否是堆(通过定义)

    1,2是。 3不是。 ly-20241212141845610

堆的用途 #

  • 当我们只关心所有数据中的最大值或者最小值,存在多次获取最大值或者最小值,多次插入或删除数据时,就可以使用堆。

    有小伙伴可能会想到用有序数组,初始化一个有序数组时间复杂度是 O(nlog(n))[也就是将一堆数字乱序排序,最快是O(nlog(n))],查找最大值或者最小值时间复杂度都是 O(1),但是,涉及到更新(插入或删除)数据时,时间复杂度为 O(n),即使是使用复杂度为 O(log(n)) 的二分法找到要插入或者删除的数据,在移动数据时也需要 O(n) 的时间复杂度。

  • 相对于有序数组而言,堆的主要优势在于更新数据效率较高

    • 堆的初始化时间复杂度为O(nlog(n)),堆可以做到O(1)的时间复杂度取出最大值或者最小值O(log(n))的时间复杂度插入或者删除数据

堆的分类 #

  • 堆分为最大堆最小堆,二者的区别在于节点的排序方式
    • 最大堆:堆中的每一个节点的值都大于子树中所有节点的值
    • 最小堆:堆中的每一个节点的值都小于子树中所有节点的值
  • 如图,图1是最大堆,图2是最小堆 ly-20241212141845906

堆的存储 #

  • 由于完全二叉树的优秀性质利用数组存储二叉树即节省空间,又方便索引(若根结点的序号为1,那么对于树中任意节点i,其左子节点序号为 2*i,右子节点序号为 2*i+1)。
  • 为了方便存储索引(二叉)堆可以用完全二叉树的形式进行存储。存储的方式如下图所示 ly-20241212141846083

堆的操作 #

  • 堆的更新操作主要包括两种:插入元素删除堆顶元素

    堆是一个公平的公司,有能力的人自然会走到与他能力所匹配的位置

插入元素 #

  1. 将要插入的元素放到最后 ly-20241212141846259
  2. 从底向上,如果父节点该元素小,则该节点和父节点交换(其实就是一棵树有3个(最多)节点,与树上最大的节点比较) 直到无法交换(已经与根节点比较过) ly-20241212141846433 ly-20241212141846614

删除堆顶元素 #

  • 根据堆的性质可知,最大堆的堆盯元素为所有元素中最大的,最小堆的堆顶元素是所有元素中最小的

  • 当我们需要多次查找最大元素或者最小元素的时候,可以利用堆来实现

  • 删除堆顶元素后,为了保持堆的性质,需要对堆的结构进行调整,我们可以将这个过程称之为堆化

    1. 自底向上的堆化,上述的插入元素所使用的,就是自顶向上的堆化,元素从最底部向上移动
    2. 自顶向下的堆化,元素由顶部向下移动。在讲解删除堆顶元素的方法时,我将阐述这两种操作的过程
  • 自底向上堆化

    在堆这个公司中,会出现老大离职的现象,老大离职之后,它的位置就空出来了

    1. 首先删除堆顶元素,使得数组中下标为1的位置空出 ly-20241212141846789

      ...

转载自https://github.com/Snailclimb/JavaGuide(添加小部分笔记)感谢作者!

  • 图是一种较为复杂的非线性结构
  • 线性数据结构的元素满足唯一的线性关系,每个元素(除第一个和最后一个外)只有一个直接前驱和一个直接后继
  • 树形数据结构的元素之间有着明显的层级关系
  • 图形结构的元素之间的关系是任意的
    • 图就是由顶点有穷非空集合和顶点之间的组成的集合,通常表示为:G(V,E),其中,G表示一个图,V表示顶点的集合,E表示边的集合
    • 下面显示的即这种数据结构,而且还是一张有向图 ly-20241212141841748

图的基本概念 #

顶点 #

  • 图中的数据元素,我们称之为顶点,图至少有一个顶点有穷非空集合)
  • 对应到好友关系图,每一个用户就代表一个顶点

#

  • 顶点之间的关系表示
  • 对应到好友关系图,两个用户是好友的话,那两者之间就存在一条

#

  • 度表示一个顶点包含多少条边
  • 有向图中,分为出度入度,出度表示从该顶点出去的边的条数,入度表示从进入该顶点的边的条数
  • 对应到好友关系图,度就代表了某个人的好友数量

无向图和有向图 #

边表示的是顶点之间的关系,有的关系是双向的,比如同学关系,A是B的同学,那么B也肯定是A的同学,那么在表示A和B的关系时,就不用关注方向,用不带箭头的边表示,这样的图就是无向图

有的关系是有方向的,比如父子关系,师生关系,微博的关注关系,A是B的爸爸,但B肯定不是A的爸爸,A关注B,B不一定关注A。在这种情况下,我们就用带箭头的边表示二者的关系,这样的图就是有向图

无权图和带权图 #

对于一个关系,如果我们只关心关系的有无,而不关心关系有多强,那么就可以用无权图表示二者的关系。

对于一个关系,如果我们既关心关系的有无,也关心关系的强度,比如描述地图上两个城市的关系,需要用到距离,那么就用带权图来表示,带权图中的每一条边一个数值表示权值,代表关系的强度

下图就是一个带权有向图

ly-20241212141842057

图的存储 #

邻接矩阵存储 #

  • 邻接矩阵将图用二维矩阵存储,是一种比较直观的表示方式
  • 如果第i个顶点和第j个顶点有关系,且关系权值为n,则A[i] [j] = n
  • 在无向图中,我们只关心关系的有无,所以当顶点i顶点j有关系时,A[i] [j]=1 ; 当顶点i和顶点j没有关系时,A[i] [j] = 0 ,如下图所示
    ly-20241212141842233 无向图的邻接矩阵是一个对称矩阵,因为在无向图中,顶点i顶点j有关系,则顶点j顶点i必有关系
  • 有向图的邻接矩阵存储 ly-20241212141842414 邻接矩阵存储的方式优点是简单直接(直接使用一个二维数组即可),并且在获取两个顶点之间的关系的时候也非常高效*直接获取指定位置的数组元素。但是这种存储方式的确定啊也比较明显即 比较浪费空间

邻接表存储 #

  • 针对上面邻接矩阵比较浪费内存空间的问题,诞生了图的另一种存储方法–邻接表

  • 邻接链表使用一个链表来存储某个顶点的所有后继相邻顶点。对于图中每个顶点Vi ,把所有邻接于Vi 的顶点Vj 链接成一个单链表

    ...

线性数据结构

转载自https://github.com/Snailclimb/JavaGuide(添加小部分笔记)感谢作者!

数组 #

  • 数组(Array)是一种常见数据结构,由相同类型的元素(element)组成,并且是使用一块连续的内存来存储
  • 直接可以利用元素的**索引(index)**可以计算出该元素对应的存储地址
  • 数组的特点是:提供随机访问并且容量有限

假设数组长度为n:
访问:O(1) //访问特定位置的元素

插入:O(n) //最坏的情况插入在数组的首部并需要移动所有元素

删除:O(n) //最坏的情况发生在删除数组的开头并需要移动第一元素后面所有的元素时

ly-20241212141849981

链表 #

链表简介 #

  • 链表(LinkedList)虽然是一种线性表,但是并不会按线性的顺序存储数据,使用的不是连续的内存空间来存储数据

  • 链表的插入删除操作的复杂度为O(1),只需要直到目标位置元素的上一个元素即可。但是,在查找一个节点或者访问特定位置的节点的时候复杂度为O(n)

  • 使用链表结构可以克服数组需要预先知道数据大小的缺点,链表结构可以充分利用计算机内存空间,实现灵活的内存动态管理

    但链表不会节省空间,相比于数组会占用更多空间,因为链表中每个节点存放的还有指向其他节点的指针。除此之外,链表不具有数组随机读取的优点

链表分类 #

单链表双向链表循环链表双向循环链表

假设链表中有n个元素
访问:O(n) //访问特地给位置的元素

插入删除:O(1) //必须要知道插入元素的位置

单链表 #

  • 单链表只有一个方向,结点只有一个后继指针next指向后面的节点。因此,链表这种数据结构通常在物理内存上是不连续
  • 我们习惯性地把第一个结点叫做头结点,链表通常有一个不保存任何值的head节点(头结点),通过头结点我们可以遍历整个链表,尾结点通常指向null
  • 如下图 ly-20241212141850281

循环链表 #

  • 循环链表是一种特殊的单链表,和单链表不同的是循环链表的尾结点不是指向null,而是指向链表的头结点
  • 如图 ly-20241212141850545

双向链表 #

  • 双向链表包含两个指针,一个prev指向前一个节点,另一个next指向
  • 如图 ly-20241212141850726

双向循环链表 #

双向循环链表的最后一个节点的next指向head,而head的prev指向最后一个节点,构成一个环

ly-20241212141850919

应用场景 #

  • 如果需要支持随机访问的话,链表无法做到
  • 如果需要存储的数据元素个数不确定,并且需要经常添加删除数据的话,使用链表比较合适
  • 如果需要存储的数据元素的个数确定,并且不需要经常添加删除数据的话,使用数组比较合适

数组 vs 链表 #

  • 数组支持随机访问,链表不支持
  • 数组使用的是连续内存空间 对CPU缓存机制友好,链表则相反
  • 数组的大小固定,而链表则天然支持动态扩容。如果生命的数组过小,需要另外申请一个更大的内存空间存放数组元素,然后将原数组拷贝进去,这个操作比较耗时

#

栈简介 #

  • 栈(stack)只允许在有序的线性数据集合一端(称为栈顶top)进行加入数据(push)移除数据(pop)。因而按照**后进先出(LIFO,Last In First Out)**的原理运作。
  • 栈中,pushpop的操作都发生在栈顶
  • 栈常用一维数组链表来实现,用数组实现的叫顺序栈,用链表实现的叫做链式栈

假设堆栈中有n个元素。 访问:O(n)//最坏情况 插入删除:O(1)//顶端插入和删除元素

...