《阿里云:2022云栖大会倚天专场演讲实录:倚天开启云原生算力新时代(71页).pdf》由会员分享,可在线阅读,更多相关《阿里云:2022云栖大会倚天专场演讲实录:倚天开启云原生算力新时代(71页).pdf(71页珍藏版)》请在三个皮匠报告上搜索。
1、封面页(此页面将由下图全覆盖,此为编辑稿中的示意,将在终稿 PDF 版中做更新)(待分享)卷首语 2021 年云栖大会上,阿里云发布自研的基于 Arm v9 架构的倚天 710 芯片,这是一款云原生处理器,无超线程概念,用户可以享受物理核的极致性能体验。随后,阿里云推出了采用倚天 710 芯片的倚天云服务器,超强实例、极致性能,在阿里巴巴集团内部及外部客户的试用效果都非常好。2022 年的 11 月,我们再聚杭州云栖大会,并通举办倚天专场的技术分享,全方位展示倚天云服务器在云原生时代的性能表现。在产品层面,来自阿里云的架构师将系统、深度而又全面地介绍倚天云服务器背后的技术奥秘,包括芯片架构设计
2、、硬件架构设计、软件优化实现方案以及七大场景下的性能收益等;来自安谋科技(Arm China)的技术专家也将从 Arm 架构出发,分享 Neoverse 生态与软件迁移实践。在应用实践上,既有阿里云自身在视频云原生业务新范式的探索,数据库 RDS在技术演进方面的实践总结,也有北京科学智能研究院的嘉宾分享倚天云服务器在材料研发这一科学计算场景下的适配与调优、万核级别的算例验证。在迁移实践上,阿里云程序语言与编译器方面的技术专家将从迁移工具支持、一键式调优、软件管理以及跨架构迁移实践等方面,介绍倚天平台全栈应用性能优化与迁移最佳实践,同时也将发布开箱即用的智能优化方案和面向开发者的倚天ECS 开发
3、指南。倚天“利剑出鞘”,破晓来袭,关于“倚天 ECS 云服务器”更多内容,邀您移步正文品读。目录 一、揭秘 ECS 倚天实例背后的技术.5 二、Neoverse 生态与软件迁移.20 三、阿里云倚天 710 实例助力 ABACUS 新实践.36 四、基于倚天的视频云原生业务新范式.46 五、RDS On 倚天 ECS 的技术演进.56 六、倚天平台全栈应用性能优化与迁移最佳实践.62 一、揭秘 ECS 倚天实例背后的技术 5 一、揭秘 ECS 倚天实例背后的技术 作者:张先国,阿里云弹性计算高级架构师 11 月 15 日,阿里云 ECS 倚天实例正式开始商业化。此前,阿里巴巴在 2022 云栖
4、大会上宣布,阿里云未来两年 20%的新增算力将使用自研 CPU。11 月 5 日,云栖大会“倚天开启云原生算力新时代”专场上,阿里云弹性计算高级架构师张先国作为分享嘉宾,带来了题为云原生算力新时代:倚天 ECS 技术揭秘的主题分享,本文根据该演讲整理而成。阿里云弹性计算高级架构师 张先国 1.背景:算力需求暴涨、摩尔定律失效 当前,企业云上业务需求趋势正在大幅增长,算力需求呈“爆炸式”递增。直播/短视频行业每天有上亿用户产出 UGC 视频内容发布在不同平台,产生百万核级视频编码算力需求和高业务成本。基因/制药行业涉及到的分子动力学模拟、基因序列对比、蛋白结构分析,原来以实验为主,今天计算机模拟
5、为主,从原子-分子单位的行为进行计算,消耗大量的算力。一、揭秘 ECS 倚天实例背后的技术 6 电商行业从流量为主转变为精益化运营过程中所需的 AI 推理、大数据画像,智能精准推荐对算力需求也越来越旺盛。以 AI 为代表的算力规模每三个半月就会翻一倍。然而,在算力需求暴涨的同时,摩尔定律演进速度却在减慢,硬件技术进步的红利见底。如今,每迭代一代 CPU,服务器和数据中心的功耗和成本攀升,每千瓦芯片功耗在生命周期内带来上万美金的成本;硬件和芯片的成本也在逐代上涨。在云这类面向多租户的场景下,超线程(HT)架构的问题逐渐暴露出来,面对一些高密计算任务时很难满足业务需求,共享内存与物理核的机制导致租
6、户之间处理任务可能需要相互排队,导致性能大幅下降;或者互相干扰的情况导致性能波动。一、揭秘 ECS 倚天实例背后的技术 7 如何能在实现高性能(减少干扰)的同时实现低功耗、低成本?我们认为,以此前的技术方案,无法解决业务需求和痛点,需要设计一款云原生芯片,结合现有的阿里云软硬件架构,才能更好地解决客户应用的需求。我们先来看下结果:在编解码的场景下,ECS 倚天实例和传统实例相比,实现了 80%的性价比提升,数据库场景、AI 推理场景、大数据场景也都分别有着 30%、70%、50%的性价比有效提升。目前,ECS 倚天实例已应用于阿里巴巴集团核心业务,并服务科学研究、智能手机行业和多家知名互联网公