企业如何选择合适的 Time Series Database?

根据最近的 DB-engines 排名,主流 Time Series Database 依然是 InfluxDB、Prometheus 等。但从排行上升趋势不难看出,近一年新的 Time Series Database 崭露头角,这也说明企业技术选型的方向也越来越多。

企业如何选择合适的 Time Series Database? - TDengine Database 时序数据库

顾名思义,Time Series Database 是针对有时间戳的数据进行的优化处理的数据库,这就意味着特定的使用场景才会产生具有明显时间戳的数据。我们接触到的例如智能电表的数据、汽车行驶记录的数据、机床设备监控的数据等,很明显在诸如此类的使用场景下,产生的数据处理量也是万亿级的。那在这样的首要前提下,Time Series Database 才能发挥它的作用。这也是涛思数据为什么要做一款专门针对于物联网、车联网、工业互联网等场景设计和优化的大数据平台的原因所在。

在 Time Series Database 产品爆发的当下,如何做好 Time Series Database 的选择,也是困扰众多企业的根本问题。数据迁移的难度、后期运维的成本、更甚至是物理条件的限制等等一系列问题都会成为阻碍企业发展的一道不可逾越的鸿沟。TDengine 作为一款集群版都开源的 Time Series Database,近几年也帮助很多大厂完成了技术选型和企业数据的迁移。如果你正在为技术选型而头秃,不妨循着前人的脚步进行一番探索。

除此之外,聚焦工业互联网的和利时也从使用者的角度做过一些对比——InfluxDB、OpenTSDB、HolliTSDB 及 TDengine 四款数据库相关测试,大家也可做参考。

除了性能以外,水平扩展能力也是很多企业会考量的,如 InfluxDB 这般的 Time Series Database 目前只开源了单机版本,如果大家想要体验双开源的 Time Series Database,我们毛遂自荐一下,可以尝试进行下 TDengine 的调研测试,可能会给到大家一个意想不到的结果。

作为一款国产开源、同时也是使用 C 语言完全自主研发的 Time Series Database,TDengine 不依赖任何底层数据引擎。除了核心的快 10 倍以上的 Time Series Database 功能外,TDengine 还具备缓存、数据订阅、流式计算、消息队列等功能,为物联网数据处理提供了全栈解决方案,无需再集成 Kafka、Redis、Spark、HBase、ZooKeeper 等软件,大幅降低系统架构复杂度的同时极大提高了数据处理的性能。TDengine 还有两个针对时间序列数据所打造的核心技术创新点,分别是“一个数据采集点一张表”以及“超级表”。

此外,众多的 Time Series Database 以及传统的实时数据库,都采用自己的查询语言,有的甚至只能使用 API 来做查询。TDengine 从第一天起,就采用 SQL 做查询语言,因为 TDengine 团队认为 SQL 是世界上最简单易用、最流行的查询语言,为众多程序员所喜爱,这样降低学习门槛和应用程序迁移成本。同时,为方便大家对时间序列数据进行分析处理,TDengine 对标准 SQL 进行了扩展。

篇幅有限,关于 TDengine 的更多设计特点,大家如果有兴趣可以移步官网-文档页面进行查阅,在这里就不多做赘述了,也欢迎大家移步到我们的开源地址观摩 copy 源代码。