1、通过可解释的人工智能辅助和持续自动化技术获取具备可操作性的答案打造先进的可视化能力以应对云原生环境挑战Introduction2020 Dynatrace打造先进的可视化能力以应对云原生环境挑战2内容提要如果将可视化与持续自动化和人工智能辅助技术融为一体,就可以为企业提供具有可操作性的答案,而这正是确保云原生应用完美工作、跨团队协作全力打造最佳用户体验和业务成效所不可或缺的。第 1 章从数据采集升级到提供答案第 2 章当今的云环境要求对可视化方式进行扩充第 3 章自动化、依赖信息及人工智能离不开先进的可视化能力第 4 章通过自动化技术实现可伸缩性和完整性第 5 章通过实时绘制的拓扑结构提供各个
2、层级的依赖信息第 6 章基于因果关系的代码级人工智能技术可提供精准的答案第 7 章展望未来:通过 OpenTelemetry 实现更广泛的覆盖2020 Dynatrace打造先进的可视化能力以应对云原生环境挑战3企业通过构建大量的云环境来推动自身的数字化转型战略,但云原生环境因其与生俱来的动态性和复杂性而难以观测和运行,由此使得可视化的概念迅速升温。就 Dynatrace 而言,我们完成了自身的数字化转型,将公司重塑为云原生的敏捷型企业。我们彻底重构了我们的产品,以满足我们部分客户最先进的企业云环境在可视化、自动化及智能化方面与日俱增、面向未来的需求。我们认为,可视化固然非常重要,但只“观测”
3、数据还不够 能用这些数据给出答案并由此最终达成更好的业务成效才是关键所在。随着微服务环境日趋动态化、规模扩大到成百上千台主机,真正的挑战变为要实时弄清在整个技术栈的背景下数据的含义,以便迅速掌握对用户的影响、防止影响业务的问题骤增。这些挑战成为令人望而生畏的工作,很快就超出了即便是技艺精湛、经验丰富的操作人员的能力极限。这就是 Dynatrace 开发全然不同的软件智能平台的原因所在。.它运用自动化、人工智能辅助技术来提供解决之道,扩充了传统的可视化能力,能够适应最庞大、最复杂的环境。1就软件而言,可视化是指可根据从系统外部获取的数据来推断系统内部状态和性能的程度。从数据采集升级到提供答案第
4、1 章2020 Dynatrace4打造先进的可视化能力以应对云原生环境挑战以前传统应用性能监测(APM)出现之时,软件大多数是单体应用,而且发布周期是以年而不是以天计算。当时采用手工方式进行插装和性能基线化,虽然笨拙繁琐,但还是游刃有余的,特别是在故障模式广为人知且充分了解的情况下。随着单体应用为云原生应用所取代,规模和复杂性呈现快速增长,这使得传统监测方式难以奏效,并且会耗费越来越多的资源和成本。如今企业需要全方位的可视化能力,以便能够深入到这些动态伸缩的微服务环境的每一个组件之中,而不是针对预先定义的问题集合进行插装。其中包括多重云基础设施、Kubernetes 之类的容器调度系统、服务
5、网格、功能即服务以及多语言容器负载。此类应用要比以往更加错综复杂、难以预测。在发生故障时企业对系统健康状况问题知之甚少,而且 IT 团队采用手工方式解决问题、被动地紧急处置故障需要花费大量的时间,这会使问题越积越多,以至于客户接连不断的问题让呼叫中心应接不暇。当今云环境面临的最大挑战是要应对各种未知情况这种独特的小故障类型以往从未出现过,并且无法通过仪表板发现。它们是传统可视化概念试图解决的不断增加的痛点。当今的云环境要求对观测方式进行扩充第 2 章2020 Dynatrace5打造先进的可视化能力以应对云原生环境挑战先进的可观测能力性提出了更有效地从各个系统组件采集数据的方式,具备了全方位、
6、便利的可视化能力,能够化解云原生应用的种种挑战。大多数以前的工具侧重于采集、汇总三种主要的数据类型 指标、跟踪及日志信息 即所谓的可视化三大基石。Dynatrace 依托 OneAgent 技术率先扩大了高度动态化云环境中可视化数据的采集。除指标、日志及跟踪信息以外,Dynatrace 还采集用户体验数据,从而实现全栈式、端到端的代码级可视化能力。最重要的是,Dynatrace 拥有以下三种异乎寻常、与众不同的功能,因此它不仅能提供更多的数据,还能给出解决之道:1.持续、自动完成发现、插装,零手工配置即可确保高度动态化环境的可伸缩性和不间断的全面覆盖。2.提供拓扑结构信息,有助于了解数以十亿计