对跳表的深入理解
创始人
2024-05-29 03:13:13
0

一,如何理解跳表

简单说跳表(Skip list)就是链表的“二分查找”。redis 的有序集合用的就是跳表算法。跳表是一种各方面性能都比较优秀的动态数据结构,可以支持快速地插入、删除、查找操作,写起来也不复杂,甚至可以替代红黑树(Red-black tree)。

如下图所示,这种链表加多级索引的结构,就是跳表。从图中我们可以看出,原来没有索引的时候,查找 62 需要遍历 62 个结点,现在只需要遍历 11 个结点,速度是不是提高了很多?所以,当链表的长度 n 比较大时,比如 1000、10000 的时候,在构建索引之后,查找效率的提升就会非常明显。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-LRF61mtW-1678019194916)(…/…/data/images/skip_list.png)]

如果包含原始链表这一层,整个跳表的高度就是 log2nlog2nlog2n。我们在跳表中查询某个数据的时候,如果每一层都要遍历 mmm 个结点,那在跳表中查询一个数据的时间复杂度就是 O(m∗logn)O(m*logn)O(m∗logn)。这里的 mmm 为 333。为什么是 3 呢?解释如下。

假设我们要查找的数据是 x,在第 k 级索引中,我们遍历到 y 结点之后,发现 x 大于 y,小于后面的结点 z,所以我们通过 y 的 down 指针,从第 k 级索引下降到第 k-1 级索引。在第 k-1 级索引中,yz 之间只有 3 个结点(包含 yz),所以,我们在 K-1 级索引中最多只需要遍历 3 个结点,依次类推,每一级索引都最多只需要遍历 3 个结点。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-HufAAdzl-1678019194917)(…/…/data/images/skip_list2.png)]

通过上面的分析,我们得到 m=3,所以在跳表中查询任意数据的时间复杂度就是 O(logn)O(logn)O(logn)。

二,跳表的空间复杂度

比起单纯的单链表,跳表需要存储多级索引,肯定要消耗更多的存储空间。

跳表的空间复杂度分析并不难,假设原始链表大小为 n,那第一级索引大约有 n/2 个结点,第二级索引大约有 n/4 个结点,以此类推,每上升一级就减少一半,直到剩下 2 个结点。如果我们把每层索引的结点数写出来,就是一个等比数列。

这几级索引的结点总和就是 n/2+n/4+n/8…+8+4+2=n-2。所以,跳表的空间复杂度是 O(n)O(n)O(n)。也就是说,如果将包含 n 个结点的单链表构造成跳表,我们需要额外再用接近 n 个结点的存储空间。

在软件开发中,我们不必太在意索引占用的额外空间。在讲数据结构和算法时,我们习惯性地把要处理的数据看成整数,但是在实际的软件开发中,原始链表中存储的有可能是很大的对象,而索引结点只需要存储关键值和几个指针,并不需要存储对象,所以当对象比索引结点大很多时,那索引占用的额外空间就可以忽略了。

三,高效的动态插入和删除

前问叙述了跳表的结构定义和查找数据,实际上,跳表这个动态数据结构,不仅支持查找操作,还支持动态的插入、删除操作,而且插入、删除操作的时间复杂度也是 O(logn)O(logn)O(logn)

在单链表中,一旦定位好要插入的位置,插入结点的时间复杂度是很低的,就是 O(1)O(1)O(1)。但是,这里为了保证原始链表中数据的有序性,我们需要先找到要插入的位置,这个查找操作就会比较耗时。

对于纯粹的单链表,需要遍历每个结点,来找到插入的位置。但是,对于跳表来说,我们讲过查找某个结点的时间复杂度是 O(logn)O(logn)O(logn),所以这里查找某个数据应该插入的位置,方法也是类似的,时间复杂度也是 O(logn)O(logn)O(logn)。

四,跳表索引动态更新

当我们不停地往跳表中插入数据时,如果我们不更新索引,就有可能出现某 2 个索引结点之间数据非常多的情况。极端情况下,跳表还会退化成单链表。

五,总结

跳表使用空间换时间的设计思路,通过构建多级索引来提高查询的效率,实现了基于链表的“二分查找”。跳表是一种动态数据结构,支持快速地插入、删除、查找操作,时间复杂度都是 O(logn)O(logn)O(logn)。跳表的空间复杂度是 O(n)O(n)O(n)。不过,跳表的实现非常灵活,可以通过改变索引构建策略,有效平衡执行效率和内存消耗。虽然跳表的代码实现并不简单,但是作为一种动态数据结构,比起红黑树来说,实现要简单多了。所以很多时候,我们为了代码的简单、易读,比起红黑树,我们更倾向用跳表。

参考资料

  • 数据结构与算法之美-跳表
  • 跳表(SkipList)设计与实现

相关内容

热门资讯

中国维护国际经贸秩序的立场坚定... 应美方请求,中美经贸高层会谈在瑞士举行。中方在充分考虑全球期待、中方利益、美国业界和消费者呼吁的基础...
来自雪豹之都西宁的“礼物” 雪豹文创。本报记者 陆广涛 摄本报记者 张慧慧“这个设计很有特点!”“妈妈,我想把这个雪豹毛绒公仔带...
330千伏玉树二回接入工程 保... 本报讯 (记者 董洁 通讯员 王宏霞) “地区电力调度控制中心已下令,现在请大家按照调度指令开展作业...
开展家庭教育指导 检护少年健康... 转自:法治日报□ 本报记者 徐鹏  近日,青海省人民检察院联合省人民法院、省妇联、省教育厅、省民政厅...
成都“送体到校”活动落幕 转自:成都日报锦观惠及35000余名学生成都“送体到校”活动落幕 本报讯 (成都日报锦观新闻...
成都蓉城豪取五连胜 转自:成都日报锦观客场4∶0梅州成都蓉城豪取五连胜 本报讯 (成都日报锦观新闻记者 胡锐凯)...
节后错峰游 成都是全国第三大热... 转自:成都日报锦观节后错峰游 成都是全国第三大热门目的地 本报讯 (成都日报锦观新闻记者 杨富...
李在明登记成为韩国总统候选人 转自:成都日报锦观李在明登记成为韩国总统候选人 韩国共同民主党总统候选人李在明10日正式登记成...
结婚领证不用户口簿 还需哪些材... 转自:成都日报锦观结婚领证不用户口簿 还需哪些材料?民政部就婚姻登记“全国通办”政策作七问七答 ...
平凡铸就伟大 劳动闪耀滇池——... 在大渔街道新村社区里,有这样一位令人敬仰的劳动者——刘琼丽,她不仅是民间画的坚守者,更是一名优秀的共...
中医药非遗展讲述“生生之道” 日前,“生生之道——中医药非遗主题展”在北京中国非物质文化遗产馆开幕。展览展示了近50项传统医药类非...
从历史长河到现实岸畔的幽远沉思 王昭君、蔡文姬、冼夫人、刘禹锡、陆游、李清照、柳如是、黄遵宪……这一个个耳熟能详的名字,从杜卫东的书...
当外国人也爱上中国字 阅读提示 4月20日是第16个联合国中文日,由河南省人民政府主办,联合国教科文组织、中日韩合作...
《几生修得到梅花:有所思堂诗稿... 本报讯 近日,朱小平诗集《几生修得到梅花:有所思堂诗稿》由中国华侨出版社再版。这本诗集情真意切,旨...
母爱,铭刻在骨头里 《母爱情深》(中国青年出版社)是厉彦林纪念母亲去世十周年出版的一部散文专著。书中,作者以深沉与哀思、...
宣布停火后 印控克什米尔地区再...   当地时间10日晚,印控克什米尔地区再次传出爆炸声。  地区官员奥马尔·阿卜杜勒(Omar Abd...
绿茵燃情 高原放歌 五月的西宁,丁香绽放,花香四溢。夏都西宁·雪豹之都·丁香之城的绿茵场上,一场足球盛宴——第二届“大美...
首届中国新疆民间艺术季优秀节目... 本报讯(记者 师晓琼 摄影报道)5月9日,首届中国新疆民间艺术季优秀节目巡演青海站活动在经久不息的掌...
佩斯科夫:俄会考虑30天停火提... △佩斯科夫(资料图)  总台记者当地时间5月10日获悉,俄罗斯总统新闻秘书佩斯科夫在接受美国媒体采访...
今天是母亲节 记得跟妈妈说 我... 123海报设计:卢文茂、蒋应杰来源:中国兰州网、兰州发布编辑:柴任翔