小 T 导读:水环境综合治理运维系统中需要对截流井设备中的液位、电流、硫化氢等进行监测,并通过PLC程序进行自动化管理设备的启停与报警短信推送。传感器采集的信息通过MQTT协议传到网关,网关收集到信息后会定时推送到业务后台服务,由服务层来做数据存储和实时分析。设备运行业务数据放在MySQL里面,液位、电流频率、硫化氢、雨量物联网数据放在TDengine Database中。
TDengine应用场景
1. 时序数据类型及规模
在水环境综合治理运维系统中,使用TDengine Database的数据存储各类终端设备的采集数据,比如硫化氢、电压、电流、雨量、温度、液位、闸门、风机、排风扇、溶解氧等信息。
目前系统上存在20个点每个点有80+个监测数据上传,每日新增的监测数据量约为100MB。如果按照此类设备的增量,后面会达到2000个点每天将近10G的数据量。
现场设备监测数据图例:
时序数据库部分存储量图例:
水环境综合治理运维系统图例:
2. 数据模型的设计
目前已每个监测点的id作为TAGS创建了超级表STable。
首先创建超级表:
CREATE TABLE DevTagValue (createTime timestamp,sampleTime timestamp,tagName binary(100),updateTime binary(50),tagValue binary(50),devID binary(50),Id binary(50))
TAGS (location binary(100))
创建子表:
CREATE TABLE devtagvalue_300219010764 USING DevTagValue TAGS ('300219010764');
CREATE TABLE devtagvalue_300219030026 USING DevTagValue TAGS ('300219030026');
一个点一张表,这样做的优势是非常明显,监测点的数据根据id插入到对应子表中,其中子表是根据业务动态创建的。对其作指定时间范围的查询,不用考虑子表的数据,直接从时间戳索引得到想要时间范围的数据,效率很高。
选择TDengine的理由
在系统前期的版本中,我们使用了MySQL数据库来存储设备上报数据。但接入系统的设备量日益增长、用户对数据实时性反馈的要求也越来越高,MySQL已经无法满足业务需求。我们发现将设备数据转移到时序数据库TDengine中存储是个更好的解决方案。
刚开始MySQL中存储了一个点上报的所有数据频率普遍在秒级,对一个表的插入与查询的压力过大,然后以站点进行了分表操作。效果好了点,由于数据量太大查询效率极低。总结规律后根据监测数据的类型进行分表操作,这样对于一个点效果明显提升,但是业务在不断扩张,站点在不断增加的情况下频繁的跨表操作MySQL查询出现了延时甚至超时死锁的情况。
时序库的选型
OpenTSDB + HBase
这个方案目前使用的人比较多,但有写缺陷。
1. HBase集群配置要求高,需要很好的调优,需要专门精通人员去维护增加了不少人员成本。
2. OpenTSDB默认的compaction策略每到整点都会对上一小时的数据查询出来compact成一行,写入到HBase,删除原始数据,这个相当耗费cpu。即使关闭compaction,修改tsd.storage.enable_appends = true 启用append的方式低配机器 cpu也是相当高。综合考虑人员及服务器等成本还是放弃了。
TDengine
TDengine是一个简单快捷高性能的时序数据库(Time-Series Database),提供高性能的同时大大降低了安装、部署、维护的成本,是当前水环境综合运维系统底层采用的变量数据存储引擎。TDengine解决了我们几个之前较为头疼的问题。
1. 安装简单
下载rpm包,一个命令安装完毕即可运行。
2. 性能强劲
测试场景:
十万张点表,每个点表1s需要存储1条记录。在实际测试过程中,使用http接口,采用单机4C16G的配置,8线程每次写500条记录,10万条记录写入只需要300ms(如果使用java客户端更快);单变量采样查询基本在2ms内完成。整个测试持续了48小时,测试期间cpu在20%-30%之间,内存维持在6G左右,写入相当稳定,没有出现超时。
综合考虑,使用TDengine硬件成本和开发维护成本大大降低,写入和查询速度还比OpenTSDB等高一个级别。使用MySQL查询3个点一年的数据直接请求超时,使用TDengine基本就2s左右就能返回给页面进行渲染。
总结
万朗智水采用TDengine后节省了其他方案搭建集群的费用,并且在写入速度和查询性能方面完全满足了业务的需求,作为一款为物联网场景设计的时序数据库,TDengine确实展现了在设备多、采集频率高的情形下显示出其性能高、架构简答的优势。相同的设备实时数据查询场景。其超级表的设计省去了不少联表查询逻辑,大大简化了业务层的开发工作。我们当前的系统已经发挥出其数据缓存和时序索引的能力,会在后面继续探索使用下TDengine的流式计算和订阅的功能,充分发挥底层数据库的功能,再进一步优化平台的系统架构。
作者介绍:
武择丰,上海万朗智水科技有限公司研发部研发工程师,开源社区爱好者,目前负责智水公司所有项目后台框架搭建,业务研发等工作。
原发首发于:https://blog.csdn.net/Demo_1/article/details/107376239