1、 1 21全体大会 2 图灵研究所数学家 Terry Lyons:签名与数据流数据科学中的新数学整理:智源社区 罗丽在 2020 北京智源大会第二次全体大会上,图灵研究所数学家 Terry Lyons 介绍了数据科学中新的研究领域“Signatures and Streamed Data”,即签名和流数据。他的演讲题目是:Mathematics of rough paths action recognition and health(粗糙路径的数学动作识别与健康)。在演讲中 Terry Lyons 表示,“粗糙路径理论”是数学中一个新领域,而“路径签名”是一种新的数学工具,它为传统的机器学习的
2、研究提供新思路,以更好地“理解”演化数据流。“粗糙路径理论”的目标是开发一个强大的数学框架,以系统地理解不断演化的多模数据中的模式,并对这些模式进行分类,用于构建 PyTorch、TensorFlow 等的工具,以便从多模流中学习。最后,他分享了数据流和签名在精神病学、阿尔兹海默病等智能治疗研究中的重要意义。Terry Lyons:牛津大学 Wallis 讲习数学教授,英国牛津大学数学学院教授,Alan 图灵研究所研究员,国际知名数学家,曾任伦敦数学学会主席,英国皇家学会院士,国际数理统计学会会士,2000 年获得 Polya 奖。主要研究领域为:随机分析、粗糙路径,随机分析在金融大数据上的应
3、用。正文:数学在我们的世界中具有重要影响,而数据科学为我们提供了了解数学和了解世界的窗口,它对人们看待问题的方式也会产生重要的影响。粗糙路径是用于处理复杂演化系统的数学语言。在我们所处的真实世界中,存在着很多演化现象,比如人类行为的演化。为什么演化意味着某种事物会随着时间而变化?实际上,理解如何能够自动地识别行为是非常重要的,而这种研究可能是人类行为的研究。图 1:人类行为 3 在观看以上图像时,我们可能会想到两个完全不同的问题。一是识别图中事物,比如,识别图中所有的树、人等,这是一项非常成熟且非常重要的研究内容,而另一个让 Terry Lyons 真正感兴趣的研究,是了解图像中事物变化的方式
4、,这是一个非常不同且具有挑战性的研究内容。即使是一个很小的群体,例如小于 9 的数字,当我们按顺序进行研究时,产生的可能性远远大于我们所能考虑到的对象的数量。“粗糙路径理论”是一个新的数学研究领域,也是数学的一部分,它是我们理解高度复杂理论演化数据的框架,经过 20 年的发展,现在已经发展地相对成熟,且具有一定的影响力。粗糙路径理论在数据科学中的早期应用实际上是由 Facebook 的 Ben Graham 提出的,Ben Graham 在研究理解在线中文笔迹时,运用了粗糙路径理论中的一些技术来改进他的研究分析,并获得成功。图 2:在线中文笔记 APP之后,科学家们试图将其设计为图中所示的 A
5、PP(应用程序),它能够翻译数十亿的字符,在经过一段时间的吸收发展之后,得到了良好的运用效果。“路径签名”能够以通俗易懂的方式向我们解释:为什么它能告诉我们一些重要的事情;数据科学为什么能够改变我们处理某些问题能力。Terry Lyons 通过介绍几个可访问的应用程序,使我们对复杂顺序数据有所了解,他表示可以通过使用静态图像,成功地抽象出一个场景,并使用开放式或阿尔法式(例如地标位置)的地标,使我们能够理解一个人在做什么。通过图像,所有人都可以理解火柴人的行为代表人类行为。而火柴人是如何运动的呢?问题的关键是,它不再是一个人,而是一系列的位置。人的左手腕、右手腕、肘部、脚,以及所有的部位都被赋
6、予了一个值,而实际上,这个值是它们在平面上的位置。因为是在图像中,所以图像中的参数也同样有效。所以,实际上我们将获得一系列标签,该标签具有附加的向量。在案例中,是在中等 4 高维空间中得到这些路径的,在这种情况下,可以得到每个标签的真实尺寸,因此,可能有 30 或 40 维路径,而目标是尝试从这 40 维路径中了解正在发生的事情。有人可能认为,可以通过深度学习理解,在某种程度上是可行的,但研究的挑战在于,需要通过相对较少的数据、样本,和具有一定解释性的方法来获取数据,结果证明数学可以做到这两方面。使用相对较少的样本进行工作的能力极大地增加了使用这种方法的用户范围。因为在在心理研究、社会科学和公