当前位置:首页 > 报告详情

【格睿时代冯家纯】云原生时序时序数据库的挑战的架构设计.pdf

上传人: s**** 编号:157172 2024-03-16 39页 7.19MB

1、云原生时序数据库的挑战和架构设计Greptime/冯家纯关于我 Greptime 技术联创 负责时序数据库产品研发 分布式共识算法库 SOFAJRaft 开源负责人PART 1什么是时序数据什么是时序数据PART 3面向弹性设计的 ServerlessDB 架构PART 2时序数据特有的挑战PART 4交流&QA什么是时序数据?什么是时序数据?记录事物随着时间推移的变化可视化展示、数据分析时序数据模型时序数据模型metriccitydistricttimestampvaluetemperature_minBeijingHaidian168632640018temperature_minBeij

2、ingHaidian168641280018temperature_maxBeijingHaidian168632640031temperature_maxBeijingHaidian168641280032metriccitydistricttimestamptemperature_mintemperature_maxtemperatureBeijingHaidian16863264001831temperatureBeijingHaidian16864128001832多值模型:面向数据源建模单值模型:面向业务指标数据建模行业时序数据库现状行业时序数据库现状时序数据应用场景时序数据应用场景

3、 Internet of things智能家居、可穿戴设备、工业传感器 金融数据股票价格、交易量、市场指数分析和预测 系统监控/可观测CPU、Mem、IO 新能源汽车CAN 信号、电池为什么需要时序数据库?为什么需要时序数据库?数据规模大传统 DB 难满足时序数据库诞生 检测点多,信息量大 数据高频产生,高吞吐摄入 存储成本敏感 存储成本高 维护成本高 写入吞吐低 时序分析能力差 低成本存储 高并发写入 低延时多维时序查询PART 1什么是时序数据PART 3面向弹性设计的 ServerlessDB 架构PART 2时序数据特有的挑战时序数据特有的挑战PART 4交流&QA 高基数(High-

4、Cardinality)(High-Cardinality)问题高基数是如何产生的高基数是如何产生的Time-series 数量高基数是如何产生的高基数是如何产生的Tag 拥有无限多的值高基数是如何产生的高基数是如何产生的高基数带来的问题高基数带来的问题写入问题索引膨胀查询问题一次查询涉及到多少个 TSIDwhere status=“200”and method=“get”高基数的解法高基数的解法 垂直:Time Interval Chunk Index 水平:Sharding Key 分区扫描+剪枝 Async Smart Index 时序数据压缩时序数据压缩时序数据压缩-Gorilla -

5、Gorilla 压缩压缩1)按照时间戳组织数据2)Delta-of-Delta 对时间戳编码3)对浮点数的二进制表示进行异或运算压缩比:3x 8x,16 字节=2-5 字节Timestamp:Delta-of-DeltaTimestamp:Delta-of-DeltaTimestamp:Delta-of-DeltaTimestamp:Delta-of-Deltafloat64:XORfloat64:XOR1 bit 符号位11 bit 指数位52 bit 小数位float64:XORfloat64:XORGorilla Gorilla 已经够好了吗?已经够好了吗?Gorilla Gorilla

6、 已经够好了吗?已经够好了吗?1)浮点数 =整数(*10N)2)低熵数据=ZSTD 再压缩3)冷热分离=不同压缩级别PART 1什么是时序数据PART 3面向弹性设计的面向弹性设计的 ServerlessDB ServerlessDB 架构架构PART 2时序数据特有的挑战PART 4交流&QA 存算分离、算算分离 GreptimeDB 简介 Workload 抽象 基于 Workload 的流控 自动驾驶传统架构传统架构-存算一体存算一体 Shared Nothing 存储和算力强绑定 粗粒度资源分配传统架构传统

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了云原生时序数据库面临的挑战和架构设计。时序数据是随时间变化的事物记录,通常以<值, 时间戳>的形式存储。时序数据模型包括单值模型和多值模型,应用场景包括物联网、金融数据、系统监控和新能源汽车等。然而,时序数据规模大、数据高频产生、存储成本敏感等问题使得传统数据库难以满足需求,因此时序数据库应运而生。时序数据库需要解决高基数问题、数据压缩和存算分离等挑战。GreptimeDB是一种面向弹性设计的ServerlessDB架构,通过时间间隔块索引、水平分片键、分区扫描和智能索引等技术解决高基数问题,通过Gorilla压缩等技术实现数据压缩,通过存算分离和算算分离实现资源的高效利用。
"时序数据如何影响业务指标?" "ServerlessDB如何应对高基数挑战?" "时序数据库如何实现弹性设计?"
客服
商务合作
小程序
服务号
折叠