从实时数据库转战时序数据库,他陪伴 TDengine 从 1.0 走到 3.0

关于采访嘉宾

在关胜亮的学生时代,“神童”这个称号如影随形,很多人初听时会觉得这个称谓略显夸张,有些人还会认为这是不是就是一种调侃,但是如果你听说过他的经历,就会理解这一称号的意义所在了。

受到教师母亲的影响,关胜亮从记事起就“长”在了教室后排,提前开启了启蒙教育,这也使得他在四周岁直接就读了一年级。尽管所在村庄的教育条件非常有限,他仍然凭借着优异的成绩,在 16 周岁就进入了中国科学技术大学化学物理系,并拿到学校和政府合计 13000 元的助学奖金。要知道,2001 年时科大和清北差距并不大,在关胜亮所在的吉林省被并称为“三校”。更有意义的是,他的求学故事给家乡燃起了一把希望之火,让教育观念薄弱的村里人发现“原来上学也是孩子可以选择的出路”。

进入大学后,彼时还是大一新生的关胜亮通过旁听招聘会,分析出了日后理科学生的工作出路,无非就是留校、研究所、出国几类,当时科大理科相关专业能够获得全额奖学金并出国的比例大约为 20% ~ 30%,似乎也是一个不错的选择,但在接触 C 语言和数据结构的课程后,他发现自己更喜欢坐在电脑旁边写点程序。就这样,关胜亮确定了自己的未来发展方向,并成功从化学物理系转到了新开设的软件工程系,开启了自己的“程序员”生涯。

与涛思结缘,始于一个“无奈之举”

对于关胜亮来说,当初选择数据库这个就业方向,其实纯粹就是一个“无奈之举”。

“我研究生就读于中科院计算所,专业是虚拟现实,本来最对口的方向是一直火到现在的游戏行业,为了一纸户口,我进入了一家做实时数据库的企业,它和时序数据库(Time Series Database)还不一样,只能存储当前时间的数据,历史数据是存储在其他系统的。就这样我一直做了很多年的实时数据库,一度觉得实时数据库是明日黄花了。”

虽然这在当时看起来并不是一个最佳选择,但人生也没有绝对正确的选择,机会总是留给善于思考且有所准备的人,关胜亮深谙这个道理。“选择赛道,其实是在考虑如何生产出一个能卖钱的产品,要相信硬核技术永远都不会过时,只有技术才能带来新的元素。因此,与其选择赛道不如沉淀自己,找到自己的核心竞争力在哪里,看准时机将创业风口与自身专长相结合,技术才是第一生产力。”

2017 年,从 360 过渡到只有几个人的创业公司涛思数据,他没有过多犹豫,在发现自己在时序数据、分布式方面的技术储备,以及在监控领域的业务储备,正好与这个产品完全匹配后,他欣然选择了加入。“我想和 Jeff(TDengine 创始人与核心研发陶建辉) 一起,开发出一个行业领先的数据库产品,重新点亮我的职业生涯,让我十余年的知识积累能够发挥出更大的作用。”

到现在,关胜亮加入涛思也有了 6 年时间,而在这 6 年时间中,他也确实将自己的所学毫无保留地倾注在了 TDengine 这款产品之中。

“在涛思数据,我就是一块砖,哪里需要哪里搬。我组织开发了 TDengine 从 1.0 到 2.0 再到 3.0 的所有迭代版本,哪个模块缺人手,我就会补充到哪里,不但做架构、管理,也写了很多代码。打开 Github 仓库,查看 TDengine 的贡献者(https://github.com/taosdata/TDengine/graphs/contributors),可以看到我是排在第一位的。”

从实时数据库转战时序数据库,他陪伴 TDengine 从 1.0 走到 3.0 - TDengine Database 时序数据库

可以说,职业生涯到现在为止,专注于 TDengine 的产品研发就是让关胜亮最有成就感的事情了。让他欣慰的是,在涛思人的共同努力下,TDengine 已经发展成为了国内顶级的时序数据库产品,在国际上也有了一定的影响力,同时也得到了广大开发者的认可——GitHub 上已经发展了两万多的 star(https://github.com/taosdata/TDengine)。

在 IT 技术不断发展的今天,用户要想实现一种功能,一定会有很多的待选方案,但想要在一定性能条件下去实现,选择就不多了。TDengine 之所以硬核,就在于超高性能的数据处理能力。“回想 TDengine 1.x 的版本,产品的稳定性还达不到很高的标准,但我们的首批种子客户依然坚定的选择了 TDengine,一方面是对国产自研软件的支持,另一方面就是市面上没有可用的替代品。”

这也直观地说明,物联网领域确实需要一个能够真正解决问题的时序数据存储引擎。而随着 TDengine 的发展,关胜亮在 6 年前做出的选择也已经“开花结果”。

与 TDengine 同行,技术更新与海外市场两手抓

作为一个基础软件,尤其是国产基础软件,发展难度是显而易见的,也因此,从选择加入 TDengine 的那一刻开始,关胜亮就做好了长期扎根打持久战的准备。

“数据库产品一定要靠丰富的应用场景,通过时间的沉淀和场景的打磨才能发展起来。好的数据库是用出来的,不是靠几个代码高手设计出来的,决定数据库企业未来的是有效用户和应用场景,我们要做的就是在真实的场景中解决用户的痛点问题。”

从这一点出发,TDengine 开启了核心代码完全开源的发展模式,获得了数以千计的真实用户场景,如关胜亮一般的 TDengine 技术人员在这些案例的基础上总结提炼,抽象出用户的真正需求,不断调整迭代产品,不受定制开发等短期利益诱惑,始终保证着将核心研发力量投入在产品的主线发展方向上。

“开源软件想要获得长期发展,成为一个企业敢用的产品,背后一定需要一个强力的组织支撑,用以保证软件的架构稳定,保证代码质量和测试覆盖,保证软件缺陷可以稳定且及时的得到处理,越是功能强大、架构复杂的 2B 软件越是如此。”

借助开源的力量,TDengine 发展了大量的用户,为便于和用户交流沟通,涛思数据目前已运营了 20 多个用户群,各个用户群日常都非常活跃。以 TDengine 3.0 为例,一经发布,每天就有 5~600 人安装试用 TDengine,不到两周的时间已经收集了 100 个优化建议,进一步推动着产品的快速迭代。

“有的竞品攻击我们,说 TDengine 迭代速度太快,产品怎么可能稳定。这种说法非常有意思,产品稳定与否,是和质量体系有关的,和迭代速度关系不大。没有用户的使用,不要说大版本的迭代,小版本的迭代都成了无源之水。在国内竞品把目光瞄准 TDengine 时,TDengine 已经把目光瞄准了全球。”

从联合创始人的身份出发,关胜亮表示 TDengine 接下来的发展道路也已经非常清晰了。“TDengine 在国内时序数据库领域已经有了一定的江湖地位,但是海外市场的拓展还很有限。随着 TDengine 3.0 稳定性和易用性逐步增加,我对海外市场非常有信心,中国 IT 产业约占全球市场的 20%,海外市场具备更大的发展空间。在 IoT 领域,TDengine 已经解决了基础的数据读写的问题,下一步就是引入时序数据分析,在更广阔的领域推动技术的发展。

再起航:继续“六”下去

发展 6 年,TDengine 也已经沉淀了几十万行代码了,在产品架构设计和演进上,关胜亮也有着“经验之谈”。“在做开发之前,一定要考虑是在做一个产品,还是在做一个项目。作为项目,你可以选择一些主流的开源产品,不要过度设计,让项目可以快速上线;但作为一个产品,关键部分还是要以自研为主,控制核心代码,让迭代升级快速有效。”

他以 TDengine 为例进行了说明,“一个设备一张表的数据模型,作为其最核心的创新点,在三个大版本迭代时都没有变化;但是在工程实现方面,其元数据管理模块,从 1.0 的集中式管理,到 2.0 的半分布式管理,再到 3.0 的全分布式管理,完全是业务需求驱动的。集中式管理可以处理百万时间线,半分布式管理可以处理千万时间线,而全分布式则可以处理上亿的时间线,彻底解决了业界困扰的高基数问题。

从他的陈述中我们可以看到,TDengine 从 1.0、2.0 到 3.0 的演进,不是简单的数字堆积,每个版本都是真真正正的质的提升。它的成功不只是技术实现细节,更在于研发人员对时序数据特点的抽象融合,对于物联网业务的深度理解。

行文至此,关胜亮与 TDengine 的第一个六年故事就告一段落了,而他们的下一个六年也已经起航。对于关胜亮来说,他的终极目标就是让 TDengine 成为时序数据领域的事实标准,成为全球第一的时序数据库,而他也将为此继续奋斗在产品第一线。