为啥用 时序数据库 TSDB
创始人
2024-05-29 09:57:20
0

前言

其实我之前是不太了解时序数据库以及它相关的机制的,只是大概知晓它的用途。但因为公司的业务需求,我意外参与并主导了公司内部开源时序数据库influxdb的引擎改造,所以我也就顺理成章的成为时序数据库“从业者”。

造飞机的人需要时刻理解开飞机的人的需求。我不算时序数据库的使用者,但我想站在用户的角度去思考,他们需要一款怎样的“时序数据库”,我司的influxdb的第一阶段改造已经完成,所以我写下这篇文章,总结一下自己在开发中的一些思考与想法。也许有些地方还不够成熟,但胜在人会慢慢进步。

正文

一、几款优秀的时序数据库

Prometheus、Influxdb和opentsdb是三款业内比较知名且实际生产使用的时序数据库了,总的来说三款各有优缺点,这里不谈它们的性能,主要谈谈使用和生态。

Influxdb:目前开源排名最高的时序数据库,是单独的数据库,主要就是用来写入和查询数据。目前集群版已经闭源商业化,开源版仅支持单机模式。数据采集使用push模式(数据源主动将数据写入influxdb)。优势是提供类SQL的查询引擎。

InfluxDB在DB-Engines的时序数据库排名中遥遥领先

Prometheus:提供了一整套的监控体系,包括数据的采集存储报警等。仅支持单机,数据写入本地。数据采集使用的是pull模式。

opentsdb:基于hbase做的时序数据库,最大的特点是由hbase带来的横向扩展能力,最大的缺点是hbase带来的笨拙感,一旦集群扩大,运维可能会烦死人。

二、时序数据库要解决的痛点

公司内部团队曾经用mysql+中间件做过一款伪时序数据库,但是由于mysql底层的存储形式导致其天然不适应时序数据的场景。且其写入能力也完全无法满足时序数据大量写入的要求。

那么时序数据的特点是什么呢?

1、数据随着时间增长,根据维度取值,而数据纬度几乎不变。

2、持续高并发写入,设备越多,写入数量越大,而且由于定期采样,写入量平稳。但是几乎不会有更新操作(一个设备在某个时间点产生的数据不会变动)以及单独数据点的删除(通常只会删除过期时间范围内所有的数据)

3、查询一般都是查最近产生的数据,很少会去查询过期的数据。

4、设备之间的数据关联性小,同种类设备A和设备B产生的数据互相并不依赖。你并不需要join。

由上述特点结合我与iot行业相关人员的探讨,我总结出以下时序数据库要解决的痛点

1、海量设备带来的写入压力

2、如何高效存储大量纬度相同仅值和时间戳不同的数据

3、能够方便的剔除过期数据,或者能够把数据冷热分离以降低存储成本

4、传统企业it人员专业素质不高带来的对整个时序数据库体系的易用性要求

三、现有产品已经满足的和缺失的

假如你要问我写多读少的场景适合什么算法?显然那就是LSM Tree。更妙的是,时序数据很少有更新、删除操作,对事物的需求也不高,这很好的规避了LSMT对于update和delete上的缺陷。市面上的时序数据库基本都是采用LSM Tree的架构。

关于数据的压缩,很容易的能想到同纬度的数据压缩,时间戳前缀压缩等想法,这些在各家数据库都有体现。当然opentsdb似乎由于底层的hbase无法更好的针对时序数据的特点进行压缩,与之类似的问题是opentsdb必须手动去根据时间段来管理数据,而Influxdb、Prometheus包括Graphite等都是可以自己根据时间段来分割数据的。这样当你要删除过期数据时,只要删除对应的block就行。

对于数据查询,经常有人吐槽SQL不太行,所以有后面的NO-SQL出现。但是当大家真的想去做些分析时,还是不由自主的想念SQL,想在KV上用上SQL(new sql),哈哈哈,SQL真香。所以好的内置的针对时序数据的sql引擎也是让人感到愉悦、不可缺少的东西。目前Influxdb在这一块大大领先。

如果你想长时间保存数据,一个比较麻烦的问题是单机总是有容量上限的,即使你做一个上层中间件来搞一个所谓的集群。另外关于高可用,坏盘、数据迁移等等是真实的让人头痛的东西,我个人比较反感简单的双写,毕竟你要浪费两倍的CPU和内存,LSMT的Compaction带来的写放大本来就让人头疼,你还要对你的数据做两次,OMG!(李佳琦脸)真让人接受不能。

遗憾的是目前除了opentsdb似乎都落本地,麻烦事儿。

四、时序数据库架构

在数据库领域,只要你上生产,你就得考虑HA、数据可靠性,你就得考虑你的运维难度和成本,否则性能再高,也只是个PPT产物。

在时序数据库这一块,我讨厌简单的双写,同时我对于上层弄个一致性协议去搞所谓的分布式不是很感冒:只要数据要同时处理(解压,压缩)多次的,都挺浪费的。

你也可以选择分库分表分设备,但是底层似乎也是单点的,且单点上也要做主备,emmm。

我认为计算存储分离是个好方向。底层存储像hdfs一样,数据写(解压、压缩)一次,剩下两份直接副本传输(或者做EC),美妙。

上层是时序数据库引擎,下层是分布式文件/块存储。

显著的好处是对同一份数据的compaction肯定只要做一次(读取-compaction-写入文件-副本拷贝),而且免去了坏盘,物理机down等的烦恼。数据扩容/冷热分离也较为方便。同时对于一写多读相对友好(类似阿里的Polardb)

缺点嘛,多个计算节点写同一份数据比较麻烦,需要分布式锁来同步,不过在iot下设备天然可分割,设备区1的设备数据无需与设备区2的监控等数据做join等,那么为什么不能把无瓜葛的设备数据写在不同的实例里呢?这样似乎能较好的缓解写入的压力。(另一种形式的分库分表?)

这里希望有人能探讨一下。

总结

时序数据库确实在iot/监控这一方面是专精的,其在时序数据写入/查询/数据压缩方面有巨大的优势,能够解决许多用户痛点。而现有的时序数据库在存储方面还有所不足,要么是单机的,要么难以维护(opentsdb)。可改造的地方还有很多。

不过更高的查询性能,更快的写入速度,更方便低成本的运维,人人想要。一旦业务规模上来,各方面的需求都应该且会被考虑到,却并不可能都被满足。做工程本质上还是不断地做Trade Off。如何取舍还是要在实际生产应用中去选择。

相关内容

热门资讯

中芯国际:指引大“翻车”,“国... 中芯国际(0981.HK/688981.SH)北京时间2025年5月8日晚,港股盘后发布2025年度...
平谷快递小哥听到微弱呼救声,被... 转自:北京日报客户端“大姐,您别怕,我马上报警救您出来!”5月5日下午3点40分,顺丰快递小哥高海在...
男子得物买52瓶古驰香水包装是... 转自:河南商报 【#男子得物买52瓶古驰香水包装是假的#...
勇做新时代的奋斗者|青春为墨 ... 转自:中工网编者按技能人才特别是青年技能人才,是高质量发展的关键要素。当前,随着新一轮科技革命和产业...
云南省青少年科技创新大赛在楚雄...   10日上午,第39届云南省青少年科技创新大赛在楚雄彝族自治州开幕。全省1500余名“科技少年”汇...
哈工大讣告:王魁业不幸逝世 哈尔滨工业大学近日发布讣告:中国共产党党员、哈尔滨工业大学原副校长王魁业同志于2025年5月8日4时...
谷歌引入AI反诈系统,利用语言... 来源:环球网 【环球网科技综合报道】5月11日消息,据CNN报道,谷歌公司近日宣布在其旗下应用及搜索...
合盈数据亮相浙江德清 彰显数据... 转自:新华网由新华网与新华社河北分社联合主办的2025世界品牌莫干山大会燕赵品牌发展大会5月10日在...
国妇婴徐汇院区门诊楼层翻新启用... 转自:上观新闻记者今天从中国福利会国际和平妇幼保健院获悉,该院徐汇院区门诊楼层已完成翻新,重新启用。...
沁州黄小米亮相莫干山 养生珍... 新华信用杭州5月11日电(记者董道勇、孙广见)以“促消费 树品牌 兴产业 惠民生”为主题的2025区...
首都中外家庭共度国际家庭日 以... 来源:中国新闻网 中新网北京5月11日电(记者 徐婧)2025年首都中外家庭共度国际家庭日活动10日...
双向8车道!合肥一主干路,即将... #合肥一主干路即将开建#【双向8车道!合肥一主干路,即将开建】5月9日,记者从合肥城建投资控股有限公...
演员章子怡,官宣喜讯! 5月10日,章子怡工作室发文官宣好消息:《卧虎藏龙》25周年之际,章子怡在GoldGala出席奥斯卡...
孤独症少年被请合影感到小得意 来源:@华夏时报微博 【#孤独症少年被请合影感到小得意#...
鸿蒙智行发布4月辅助驾驶报告,... 来源:环球网 【环球网科技综合报道】5月11日消息,“鸿蒙智行”官方微博近日发布4月智能辅助驾驶报告...
河南省教育考试院提醒 转自:信阳发布河南省2025年上半年中小学教师资格考试(面试)温馨提醒亲爱的考生朋友:      春...
省委巡视组巡视公告! 转自:中安在线01省委第十巡视组巡视公告根据省委统一部署,省委第十巡视组于2025年5月11日至7月...
OpenAI在企业AI市场加速... 来源:环球网 【环球网科技综合报道】5月11日消息,金融数据公司Ramp发布的最新数据显示,Open...
中卫市第五次全国经济普查公报(... 转自:中卫发布根据第五次全国经济普查结果,现将我市分县(区)的第二产业和第三产业单位及从业人员基本情...
名单来了!5.19中国旅游日,... 转自:上观新闻今年5月19日是第15个中国旅游日,作为每年中国旅游日的重要内容,上海市文化和旅游局、...