《陶建辉-时序数据迎来AI智能体时代.pdf》由会员分享,可在线阅读,更多相关《陶建辉-时序数据迎来AI智能体时代.pdf(34页珍藏版)》请在三个皮匠报告上搜索。
1、时序数据迎来 AI 智能体时代陶建辉|TDengine陶建辉TDengine 创始人&CEO开源软件 TDengine 主要作者,2024 年“中国计算机学会(CCF)杰出工程师奖”获得者。1994年中国科大毕业后,到美国留学,1997年起,先后在芝加哥Motorola、3Com等公司从事移动互联网的研发工作。2008年初回到北京创办和信,后被联发科收购。2013年初创办快乐妈咪,后被太平洋网络收购。2017年5月创办涛思数据,专注物联网、工业互联网大数据的处理,产品TDengine开源后,在GitHub全球趋势排行榜上多日排名第一。涛思数据已获红杉、GGV、经纬、明势资本等多家机构的近700
2、0万美元的投资。令人振奋的 AI 时代PART 01行业知识获取需 5 到 10 年才能获取的知识,现在一周就够0101特有或私域的知识,可以依靠 RAG 技术来解决02LLM 能击败 80%以上的普通人LLM 的推理能力还在提升 020203030404运营成本训练成本和推理成本已经大幅下降LLM 的成本还会再降低无需 AI 专业知识,就可使用AI 走进工业,成本将不再是问题010102020203030404工业 AI 智能体时代从采集的数据感知运行状态基于数据自主做分析基于分析结果,给出决策建议每人拥有自己的实时数据分析助理04Self-Learning Data Platform010
3、1020202030304040505TDgpt时序数据分析 AI 智能体PART 02TDgpt 时序数据分析 AI 智能体通过 SQL 提供时序数据预测、异常检测、补齐和分类的功能支持各种时序模型、大语言模型机器学习和传统算法的动态切换通过SDK,任何新的算法、模型都可无缝集成,且无需修改应用xTDgpt 是 TDengine 内置的时序数据分析 AI 智能体,具备时序数据预测、异常检测、补齐和分类功能。它能无缝对接各种时序基础模型、大语言模型、机器学习及传统统计算法,并支持算法动态切换,用户只需通过一条 SQL 语句即可使用。此外,通过开放的 SDK,开发者能将自己开发的AI算法或模型轻
4、松集成到 TDgpt,立即为 TDengine 全行业用户所使用。时序数据预测样例表样例数据SQL 预测函数定义列名称类型说明tstimestamp主时间戳列i32int324 字节整数,设备测量值 metric1.column_expr:预测的时序数据列,只支持数值类型列输入。2.options:预测函数的参数。字符串类型,其中使用 K=V 方式调用算法及相关参数。采用逗号分隔的 K=V 字符串表示,其中的字符串不需要使用单引号、双引号、或转义号等符号,不能使用中文及其他宽字符。预测支持 conf,every,rows,start,rows 几个控制参数,其含义如下:时序数据预测1.预测查询
5、结果新增三个伪列,具体如下:_FROWTS:预测结果的时间戳、_FLOW:置信区间下界、_FHIGH:置信区间上界,对于没有置信区间的预测算法,其置信区间同预测结果2.更改参数 START:返回预测结果的起始时间,改变起始时间不会影响返回的预测数值,只影响起始时间。3.EVERY:可以与输入数据的采样频率不同。采样频率只能低于或等于输入数据采样频率,不能高于输入数据的采样频率。4.对于某些不需要计算置信区间的算法,即使指定了置信区间,返回的结果中其上下界退化成为一个点。参数说明示例时序数据异常检测1.column_name:进行时序数据异常检测的输入数据列,当前只支持单列,且只能是数值类型2.
6、options:字符串。其中使用 K=V 调用异常检测算法及与算法相关的参数。采用逗号分隔的 K=V 字符串表示,其中的字符串不需要使用单引号、双引号、或转义号等符号,不能使用中文及其他宽字符。例如:algo=ksigma,k=2 表示进行异常检测的算法是 ksigma,该算法接受的输入参数是 2。3.异常检测的结果可以作为外层查询的子查询输入,在 SELECT 子句中使用的聚合函数或标量函数与其他类型的窗口查询相同。4.输入数据默认进行白噪声检查,如果输入数据是白噪声,将不会有任何(异常)窗口信息返回。SQL 异常检测函数定义时序数据异常检测1.用户可以针对异常窗口内的时序数据进行查询聚合、