1、快速搭建一超高性能的时序空间大数据处理平台快速搭建一超高性能的时序空间大数据处理平台u 时序空间数据特点u 现有方案的弊端u TDengine基本介绍u 如何应对每天都在变化的大数据分析需求u 机械设备监测数据的实时计算大数据时代数据采集后被源源不断的发往云端+物联网、工业4.0的技术链传感器数据采集通讯模组边缘计算云数据引擎(存储查询计算)分析应用系统所有采集的数据都是时序的数据都是结构化的一个采集点的数据一定是它产生的数据很少有更新或删除操作数据一般是按到期日期来删除的物联网、工业4.0数据特征:时序空间数据采集的数据量巨大,但有典型特征:数据以写操作为主,读操作为辅数据流量平稳,可以较为
2、准确的计算数据都有统计、聚合等实时计算操作数据一定是指定时间段和指定区域查找的数据量巨大,一天的数据量就超过100亿条12346789510通用的解决方案将开源的Kafka,Redis,Hbase,MongoDB,Cassandra,ES,Hadoop,Spark,Zookeeper等大数据软件拼装起来,利用集群来处理海量数据。面临的挑战开发效率低因牵涉到多种系统,每种系统有自己的开发语言和工具,开发精力花在了系统联调上,而且数据的一致性难以保证运行效率差非结构化数据技术来处理结构化数据,整体性能不够,系统资源消耗大。因为多套系统,数据需要在各系统之间传输,造成额外的运行代价运维复杂每个系统都
3、有自己的运维后台,带来更高的运维代价,出问题后难以跟踪解决,系统的不稳定性大幅上升应用推向市场慢集成复杂,得不到专业服务,项目实施周期长,导致人力攀升,利润缩水TDengine应运而生TDengine 提供的功能消息队列缓存流式计算订阅数据库完整的时序空间数据处理引擎TDengine 技术亮点快10倍的插入和查询通过创新的存储设计,并采用无锁设计和多核技术,让数据插入和查询的速度比现有专业的时序数据库提高了10倍以上超融合将大数据处理需要的消息队列、缓存、数据库、流式计算、订阅等功能融合在一起,提升运行效率,保证整个系统的数据的一致性更高的水平扩展能力通过先进的集群设计,保证了系统处理能力的水
4、平扩展,而且让数据库不再依赖昂贵的硬件和存储设备,不存在任何单点瓶颈和故障零学习成本使用标准的SQL语法,并支持JDBC,ODBC,REST接口,应用API与MySQL高度相似,让学习成本几乎为零极低的资源消耗整个完整安装包才1.2M,内存的最低要求不到1M,计算资源不到通用方案的1/5。通过列式存储和先进的压缩算法,存储空间不到传统数据库的1/10。零运维管理成本追求极致的用户体验,将复杂的运维工作完全智能化。无需分库分表,数据备份、数据恢复完全自动;扩容、升级、IDC机房迁移轻松完成云服务或硬件成本不及通用方案的1/10研发成本大幅降低,无需培训、无需集成其他软件零管理,后期运营管理成本大
5、幅下降硬件云服务成本研发成本运营成本TDengine 整体成本优势对比测试完整对比测试报告,请参阅:对比测试完整对比测试报告,请参阅:充分利用物联网数据特点对于一个数据采集点而言,只有一个写结构化数据s时序的。不基于任何开源产品,C/C+开发了存储引擎集群调度、管理计算模块SQL解析。TDengine 性能指标为何这么出众量身定制只为物联网数 据而设计不适合电商、社区、ERP、CRMTDengine 系统结构V0V1V3dnode 7V0V1V3M0V0V1V3V2V0V1V3V2dnode 0V0V1V3V2dnode1 dnode 2dnode 3V0V1V2dnode 4V0V1M1V2
6、dnode 5V0V2V3V1dnode 6M2V3完全无中心化设计使用KV或关系型DB,在多个数据采集点存在的情况下难以保证一个采集点的数据在内存或硬盘上的连续性TDengine,一个采集点的数据在一个块里是连续存放的,块的大小可配置采取Block Range Index,可快速定位要查找的数据所处的块0 1 2 3 4 5012345连续存放WriteAppmemorydiskCommit logVnodeFILEFILEPeerVnodeFlushTDengine 数据写入流程TDengine Metric:多个采集点的数据聚合Metric是表的集