由于 TDengine 充分利用了时序数据特点,比如结构化、很少删除或更新、写多读少等,因此与其他时序数据库相比,TDengine 有以下特点:
- 高性能:充分利用时序大数据的特点,TDengine 设计了新颖的存储引擎,大幅提升了数据的写入和查询速度,同时也大幅提高了数据压缩率。相对通用数据库,读、写、数据压缩性能至少高十倍以上;TSBS 基准测试结果显示,相对于InfluxDB、TimescaleDB,性能也是远超。TDengine 还是唯一一个解决了时序数据存储的高基数难题的时序数据库,支持上亿数据采集点,并在数据插入、查询和数据压缩上远胜其他时序数据库。
- 极简时序数据平台:TDengine 内建缓存、流式计算和数据订阅等功能,为时序数据的处理提供了极简的解决方案,从而大幅降低了业务系统的设计复杂度和运维成本。
- 云原生:通过原生的分布式设计、数据分片和分区、存算分离、RAFT 协议、Kubernetes 部署和完整的可观测性,TDengine 是一款云原生时序数据库并且能够部署在公有云、私有云和混合云上。
- 简单易用:对系统管理员来说,TDengine 大幅降低了管理和维护的代价。对开发者来说, TDengine 提供了简单的接口、极简的解决方案和与第三方工具的无缝集成。对数据分析专家来说,TDengine 提供了便捷的数据访问能力。
- 支持 AI 的高级数据分析:TDengine 通过 SQL 和时序数据扩展,提供内建的分析能力,并支持实时流式计算。能与众多第三方批分析、实时分析、报表工具、AI/ML 工具、可视化工具无缝集成,如 Grafana、帆软、永洪、PowerBI 等。
- 核心开源:TDengine 的核心代码包括集群功能全部在开源协议下公开。到目前为止,TDengine 项目在 GitHub 上总共收获了 star,全球安装实例数已经超过 ,拥有一个活跃的开发者社区。
采用 TDengine,可将典型的物联网、车联网、工业互联网大数据平台的总拥有成本大幅降低。表现在几个方面。
性能比通用时序数据库性能好 10 倍以上,远超其他时序数据库
通过充分利用时序大数据的特点,TDengine Database 团队设计了新颖的存储引擎,大幅提升了数据的写入和查询速度,同时也大幅提高了数据压缩率。与通用数据库相比,性能好至少十倍以上,而存储空间不到其 1/5,与其他时序数据库相比,性能也是远超。
在 DevOps 场景下,TSBS 基准测试结果显示 TDengine 写入性能最大达到 TimescaleDB 的 6.7 倍,InfluxDB 的 10.6 倍。此外,TDengine 在写入过程中消耗了最少计算(CPU)资源和磁盘 IO 开销;相同落盘数据规模下,TDengine 存储空间只有 InfluxDB 的 25%,只有 TimescaleDB 的 4%。此外,对于大多数查询类型,TDengine 的性能均优于 InfluxDB 和 TimescaleDB,在 Complex queries 类型的查询中展现出巨大的优势——TDengine 的 Complex queries 查询性能最高达到了 InfluxDB 的 37 倍、 TimescaleDB 的 28.6 倍。
在 IoT 场景下,TSBS 基准测试结果显示 TDengine 写入性能均优于 TimescaleDB 和 InfluxDB。相对于 TimescaleDB,TDengine 写入速度最领先的场景达到其 3.3 倍,最小的为 1.04 倍,相对于 InfluxDB,TDengine 写入速度最领先的场景达到其 16.2 倍,最小为 1.82 倍。磁盘空间占用方面,TimescaleDB 在所有五个场景下数据规模均显著地大于 InfluxDB 和 TDengine,并且这种差距随着数据规模增加快速变大。TimescaleDB 在场景四和场景五中占用磁盘空间是 TDengine 的 11.6 倍和 12.2 倍。在前面三个场景中,InfluxDB 落盘后数据文件规模与 TDengine 非常接近,但是在大数据规模的场景四和场景五中,InfluxDB 落盘后文件占用的磁盘空间是 TDengine 的 2.6 倍和 2.8 倍。查询方面,在场景一(只包含 4 天的数据)与场景二的 15 个不同类型的查询中,TDengine 的查询平均响应时间全面优于 InfluxDB 和 TimescaleDB,而且在复杂查询上优势更为明显,同时具有最小的计算资源开销。
详见《高性能的时序数据库》。
对标准 SQL 进行了扩展,无缝集成众多第三方软件,降低学习门槛和应用程序迁移成本
众多的时序数据库(Time Series Database)以及传统的实时数据库(Real Time Database),都采用自己的查询语言,有的甚至只能使用 API 来做查询。TDengine 从诞生的第一天起,就采用 SQL 做为自己的查询语言,因为 TDengine 团队认为 SQL 是世界上最简单易用、最流行的查询语言,为众多程序员所喜爱,这样能够降低学习门槛和应用程序迁移成本。同时,为方便大家对时序数据进行分析处理,TDengine Database 对标准 SQL 进行了扩展。2022 年 8 月发布的 TDengine 3.0 版本更新了大量时序数据特有函数和特色查询,详见《TAOS SQL》。
对于数据分析师而言,使用 TDengine 就像在使用一个关系型数据库。详见《支持 SQL 并对时序数据处理进行扩展》
此外,TDengine 通过对标准 SQL 命令、常用数据库连接器标准(例如 JDBC)、ORM 以及其他流行时序数据库写入协议(例如 InfluxDB Line Protocol、OpenTSDB JSON、OpenTSDB Telnet 等)的支持可以使 TDengine 非常容易和第三方工具共同使用。
对于支持的第三方工具,无需任何代码,你只需要做简单的配置,就可以将 TDengine 与第三方工具无缝集成起来。详见《第三方工具》
极简的时序数据解决方案
时序数据库(Time Series Database, TSDB)是一个专门为时序数据优化设计的数据库,用于以高效的方式存储和分析时序数据。但是时序数据处理需要的不仅仅是存储和分析。
在典型的时序数据处理平台中,采集的数据往往先写入消息队列,然后通过消费,写入数据库(如 HBase、MongoDB 或 MySQL)做持久化存储,同时往往写入 Redis 将最新数据缓存起来,还将数据送入 Spark 或 Flink 等流式计算工具做实时分析,流式计算的结果往往也会写入数据库做存储。应用需要与 Redis、Database 以及 Spark 这些工具集成。这使得系统设计复杂且难以维护。此外,它还需要消耗更多的计算和存储资源。
TDengine 内置缓存、流处理和数据订阅功能,处理时序数据不再需要 Kafka、Redis、Spark、Flink 或其他类似工具。降低了系统设计复杂度和运行成本。它不仅提供了一种高效的时间序列数据存储和分析方式,还为时间序列数据处理提供了一种极简的解决方案(Simplified Solution for Time Series Data)。详见《极简的时序数据处理平台》。
灵活的定价策略
TDengine Cloud 提供灵活的定价策略。用户可以按需付费,根据自己的预算选择最合适的部署模式,免去了过度配置,可获得最具性价比的价格。
此外,TDengine Cloud 目前注册,即送 600 元现金券,选择“入门版”套餐,可用一个月,方便用户在本地系统上进行概念验证(POC),确保 TDengine 适合所在业务场景,然后再选择付费购买。
了解更多 >>