在工业节能和智能化转型的浪潮中,蘑菇物联凭借其自研的灵知 AI 大模型走在行业前沿,为高能耗设备和公辅能源车间提供先进的 AI 解决方案。此次采访聚焦于蘑菇物联与 TDengine 的合作项目,通过 AI 云智控平台的建设,双方携手推动制造工厂的能源数智化管理,助力企业实现节能降碳。在本文中,我们将深入探讨蘑菇物联选择 TDengine 的原因、项目实施中的挑战与解决方案,以及合作视角下双方的未来愿景。
在工业场景中,传统人工经验的控制方法较粗放,如开工后设备常开、设备参数设置不合理、设备运行组合不合理、冗余供能等情况,这些情况往往造成设备低效运行和巨大的能源浪费。加强组织精益管理能力是一个改善点,更重要的是推动基于数据的数智化管理方法和工具在工厂落地,工厂才能充分发挥数据价值,实现降本增效提产提质。
蘑菇物联是一家工业 AI 科技公司,聚焦工业高能耗的通用工业设备以及由这些设备组成的公辅能源车间,自主研发通用工业设备领域专用的 AI 大模型——灵知 AI,率先把人工智能技术引入工业节能场景,全面采集通用设备、公辅车间数据,建模分析计算工厂能源供给端与需求端数据,解决工厂“冗余供能”的难题,实现按需供能,为工业企业创造安全供能、无人值守、可持续节能降碳三大可测量价值。
蘑菇物联自主研发的公辅能源云智控节能管理平台,可实现设备级-车间级-工厂级-集团级四层架构的能源管理与节能控制优化,尤其针对空压站、制冷站等重点耗能场景进行控制优化节能,并且实现数据驱动的预测性维护。该平台支持灵活的模块化部署,既可以按场景拆分独立部署,也可支持组合部署以覆盖水、电、气、冷等不同类型的能源场景。同时,通过多租户模式为客户提供服务,目前已服务超 1600 多家工业企业,每天处理约 100GB 的 IoT 数据。
在服务工业企业数智化转型的过程中,蘑菇物联面临的客户场景,既有行业共性,又有业务的独特性,并且“作为一个平台型产品,数据存储需要与业务场景解耦,支持动态定义字段名称。”蘑菇物联研发负责人解释道。在公辅场景中,由于设备种类繁多、品牌各异,IoT 数据量天级超过百 GB,管理与数据处理面临一定挑战,主要存在三个核心需求:
首先,对于同一类型的设备而言,各个设备的参数编码并不固定。虽然核心参数可以通过物模型进行标准化处理,但部分参数是特定型号设备才具备的。因此,系统需要具备支持动态数据入库的能力,以确保这些特有参数的数据也能被完整记录和分析。同时,为了适应业务发展和场景需求的变化,系统还需要支持新的设备类型的快速接入。这意味着在数据结构上必须具备灵活性,能够根据不同设备的特性动态新增字段,确保新设备接入后的数据也能无缝整合到现有系统中。
其次,在每天接入超百 GB 数据的情况下,需要保证提供给客户的数据响应时间在 200 毫秒级,因此系统需要具备超强的数据查询实时响应性能和较高的可用性。
第三,“我们的客户既有公有云部署需求,也有私有云部署的需求。”为了确保开发和运维效率的一致性,因此要求数据库具备支持从小规模私有化部署到大规模云端集群的能力。
蘑菇物联在项目实践中尝试过多种数据库,如 OpenTSDB、HBase、InfluxDB 及某云厂商 TSDB,每种数据库各有特点,最终经过综合考虑高性能、稳定性和数据压缩率等因素后,蘑菇物联选择与 TDengine 合作。
虚拟表结构的设计
由于 AI 云智控平台需要接入大量不同类型的设备数据,其中一些设备可能包含成千上万的 code 字段,且无法预先确定其上报的字段结构。在这种情况下,蘑菇物联无法使用 TDengine 的超级表模型(因字段结构不确定且列数有限制)。
为了解决这一问题,蘑菇物联采纳了 TDengine 团队的建议,采用普通表模型,并为每个设备建立字段映射关系(将 code 映射到子表 ID 和列名),从而实现了设备级的 Schema-less 存储,同时突破了列数限制。
高并发数据查询性能
“我们每个租户都会构建大量复杂的业务指标,并通过流式和批量方式将数据写入时序数据库。在实际业务查询中,往往需要对数百上千个业务指标进行二次加工。简单的二次加工直接在时序数据库内完成,而复杂的计算则在业务系统的内存中处理。因此,这对数据库整体性能提出了极高要求,需要确保其在数据写入与查询过程中的高效性和稳定性,才能满足复杂业务场景的需求。”
为验证所选时序数据库的性能,蘑菇物联在 8 核 CPU、32GB 内存单机配置下,对 TDengine(版本 3.2.3.0)、InfluxDB 开源版 1.8 和 InfluxDB 开源版 2.7 进行了查询性能的对比测试。
“总体而言,除了在查询大量明细数据时表现稍弱外,TDengine 在其他聚合场景的查询性能均明显优于 InfluxDB 开源版 1.8 和 2.7,提升幅度达 3-10 倍,完全满足我们的性能需求。相比 HBase 和 InfluxDB,TDengine 使大多数复杂数据查询的响应时间从秒级缩短至毫秒级,复杂报表的性能也得到了显著提升,极大地优化了产品的用户体验。这点让我们非常惊艳。”
云端与私有化部署的统一性
“TDengine 在保证数据库单机性能的前提下,开源支持了集群化部署的能力,且基于 C++ 语言开发,可以在资源受限的环境中部署,基于上述两点特性,可以满足我们公有云和私有云部署的架构一致性。”
大量指标的流/批输出和高效查询
“在我们的典型场景中,采集到的物联网数据会经过多维度的数据加工,不同的业务场景由此生成多种类型的指标。例如,电量和电费计算、折煤折碳计算、设备运行时长统计、稼动率分析、设备单机能效评估、空压站气电比、中央空调站 COP、单位产品能耗、万元产值、压力和流量预测、节能率计算等场景。”
部分指标通过流批计算直接存入数据库,另一些则需基于原始数据进行查询时二次加工。为应对这些复杂场景,蘑菇物联定制了多种复杂内置函数,以满足业务对数据处理的多样化需求。这些操作对时序数据库的写入和查询效率提出了严格要求。经过多轮验证,TDengine 在写入与查询性能上表现出色,很好地满足了蘑菇物联的业务需求。
未来展望
“TDengine 为我们的项目带来了更高的性能和灵活性,同时在云端与私有化部署方面也让开发和运维更加高效。”蘑菇物联团队表示,“在未来的合作中,我们期待与 TDengine 一起,为更多的企业创造更大的价值。”
展望未来,蘑菇物联计划在五年内连接 300 万台通用工业设备,帮助 3 万家企业完成数智化转型。通过深化与 TDengine 的合作,蘑菇物联将继续探索更多节能降碳场景,为社会的可持续发展贡献力量。
接下来,TDengine 也将继续专注于提升时序数据的处理能力,为各行业提供高效、灵活的数据解决方案。不论是在物联网、工业互联网,还是在智能制造等领域,TDengine 希望通过技术创新和不断优化,为用户带来更卓越的体验,与企业一同把握机遇,共同推动数字化时代的发展。