1、MatrixDB:数字汽和脑实践姚 延 栋创 始&C E O北 京 四 维 纵 横 数 据 技 术 有 限 公 司Confidential 2021 四维纵横姚延栋MatrixDB 创始Greenplum 北京研发中负责(2010-2020)Greenplum 中社区创始PostgreSQL 中社区常委清华学产教融合课程分布式数据系统基础及应产业负责著有Greenplum:从数据战略到实现关于我Confidential 2021 四维纵横l时序和超融合l数字汽l脑录Confidential 2021 四维纵横时 序 和 超 融 合Confidential 2021 四维纵横全数字化时代到来,拐
2、点出现2020 年物联网设备超过非物联网设备DB-Engines 过去 24个 月流行度趋势肯锡物联:抓住加速机遇指出到2026年IoT数据市场规模1000亿美,“IoT最场景在中国”。物联最典型的数据是时序数据。Confidential 2021 四维纵横什么是时序数据时序数据是时间序列数据,即带有时间戳的数据序列。这个序列中的个数据也成为数据点(datapoint),个数据点通常是个(timestamp,value)对。(ts1,v1)(ts2,v2)(ts3,v3)(tsN,vN)(,)timeseriesConfidential 2021 四维纵横什么是时序数据可以有很多时间序列,每个
3、时间序列有的节奏。(ts1,v1)(ts2,v2)(ts3,v3)(tsN,vN)(,)(ts1,v1)(ts2,v2)(ts3,v3)(tsK,vK)(,)timeseries1timeseries2Confidential 2021 四维纵横什么是时序数据时间序列都是(ts,val)序列,那么如何区分不同的时间线?不同时间线会有不同的静态属性,通过静态属性可以区分时间线。(ts1,v1)(ts2,v2)(ts3,v3)(tsN,vN)(,)(ts1,v1)(ts2,v2)(ts3,v3)(tsK,vK)(,)timeseries1timeseries2name:cpu_usage,IP:1
4、92.168.1.1name:cpu_usage,IP:192.168.1.2静态属性静态属性Confidential 2021 四维纵横什么是时序数据时间序列都是(ts,val)序列,那么如何区分不同的时间线?不同时间线会有不同的静态属性,通过静态属性可以区分时间线。时间timeseries1timeseries2timeseriesN!#$!#$!#$Confidential 2021 四维纵横什么是时序数据对时序数据的查询丰富多样:个时序的最新值,个时序在某个时间段的明细或者聚合,多个时序在个时间段的明细或者聚合,多个时序的最新值等。时间timeseries1timeseries2tim
5、eseriesN!#$!#$!#$Confidential 2021 四维纵横什么是时序数据Timeseries 之间有什么关系?这种关系是否重要?多数场景下,某些timeseries有定相关性,属于同个实体,或者有相同的静态属性时间timeseries1timeseries2timeseriesN!#$!#$!#$同一个实体,譬如同一个应用同一个机床同一辆车同一个实体,譬如同一个应用同一个机床同一辆车!#$timeseriesNConfidential 2021 四维纵横12什么是时序数据Confidential 2021 四维纵横时序数据建模三种数据建模式:1.窄表模式2.宽表模式3.树形
6、模式Confidential 2021 四维纵横时序数据建模窄表模式:个数据点,可以KV数据模型,也可以关系数据模型。注意窄表不是字意思的字段个数多少,是只表示个数据点。2021/10/01 08:00:00;设备编号=958D-7913,城市=上海;向;23.4 2021/10/01 08:00:00;设备编号=958D-7913,城市=上海;速;3.4 2021/10/01 08:00:00;设备编号=F3CC-20F3,城市=北京;向;45.1 2021/10/01 08:00:00;设备编号=F3CC-20F3,城市=北京;速;1.1 2021/10/01 08:01:00;设备编号=