什么是时间序列数据?

从 DB-Ranking 数据库热门趋势来看,时序数据库 Time Series Database (TSDB)这两年异军突起。这一类数据库大热的原因与所处理的数据类型息息相关,那时间序列数据到底是什么?为什么说时间序列数据与我们生活有着密切联系?

TDengine Database

从字面上来理解,时间序列数据就是具有时间排序的数据。百度百科的定义是:“时间序列数据是同一统一指标按时间顺序记录的数据列。”如果用一些生活中常见的数据来举例,你可能就会觉得时间序列数据并不是多么晦涩难懂了,比如我们现在家家户户都在用的智能电表。每家的每一块电表都在不同的时间记录着家中电量的消耗,电表上总在跳动的指示灯就代表着时间序列数据的跳动。那每一栋楼、每个小区甚至大到每一座城市,数以万计的智能电表在相同的时间间隔下产生的数据,我们就可以用 Time Series Database 来记录。

TDengine Database

上图是一系列的电表数据统计,从中我们可以看出时间序列数据有几个明显的特征。首先每组数据都带有时间戳,其次数据都是结构化的,以数字性为主,再从电表数据的处理与分析需求出发,我们可以总结出时间序列数据的几大特点:

1、所有采集的数据都是时序数据

2、数据都是结构化的

3、一个采集点的数据源是唯一的

4、数据很少有更新或删除操作

5、数据一定是指定时间段和指定区域查找的

6、实时数据库数据量巨大,一天的数据量就超过100亿条

TDengine Database

再以监控数据为例,上图是对某项目监控数据进行的统计分析,做过运维的小伙伴一定非常熟悉,横轴是时间,纵轴是采集量,可以看出:

1、有些时间序列数据在很长一段时间内都是固定的值,但是某些时间点也会产生异常跳变,异常检测在时间序列数据的处理过程中,也是非常重要的一环,本文不过多展开;

2、有些时间序列数据在一段时间内是一个变化趋势;

3、有些时间序列数据在一定数值范围内会进行波动,有些波动频率高,有些波动频率低;在对应上我们刚才说的时间序列数据的特点,就非常容易理解了。


通过上述文字,大家了解了时间序列数据的特点,那生活中有什么场景是可以用 Time Series Database 来处理的呢?TDengine 时序数据库(TSDB)在产品不断研发创新的过程中,也有幸结识了一些不同业务场景上需要使用 Time Series Database 的合作伙伴。简单的举个例子,出行方面有理想汽车、蔚来汽车、领跑汽车等都在车联网数据、加电基站监测等方面运用了 TDengine,快递运输行业中有顺丰科技、货拉拉等也将 TDengine 运用在了业务监测或数据监测上。但关于 Time Series Database 的应用可远不止这些,更多的经典案例欢迎大家移步 TDengine 官网-博客-用户案例中查阅,也欢迎大家和我们一起探讨。