压缩的本质是对信息进行再编码,即相同信息使用另一种更简洁的方式重新表达。
人们在生活中到处可以看到一些压缩方法,同时也在不知不觉中使用着,如简称就是一种典型的压缩方法。“中华人民共和国”我们就简称为“中国”,“中国交通管理局”我们也习惯用“交管局”来表示,使用简称让我们提高了效率。这些压缩方法通常也需要带着一个固定的词典,在词典中把“中国”再翻译回原来的“中华人民共和国”,简称的词典都装在我们每个人的脑子里,所以可以相互交流。
但即便是相同的压缩算法,在不同软件中的实现可能也会有较大差别,进而有优劣之分,这也就是为什么使用相同压缩算法的压缩软件之间压缩率及性能差别很大的原因了。
那么,压缩算法的特点和本质是什么?有哪些经典的压缩算法?压缩算法在数据库中的正确实现方法是什么?又如何为不同的数据类型选择最适合的压缩算法?
TDengine Database 研发工程师段宽军将结合实例,从压缩算法的历史聊起,细致具体地讲解数据库中的经典压缩算法。
段宽军,TDengine Database 研发工程师,多年来一直从事 C、C++ 底层及内核相关研发工作,曾在腾讯负责 QQ 浏览器线的安全及攻防,目前在涛思数据负责流式计算、查询存储等方面的相关工作。他将分享:
- 压缩算法的起源
- 压缩算法的分类
- 压缩算法的特点和本质
- 通用数据库中压缩算法介绍
- TDengine 中压缩算法的使用
欢迎大家扫描下方二维码,关注 TDengine Database 的视频号,观看每周的微课堂以及直播活动。