《何万青:阿里云弹性高性能计算E-HPC-云之彼端是青藏高原(30页).pdf》由会员分享,可在线阅读,更多相关《何万青:阿里云弹性高性能计算E-HPC-云之彼端是青藏高原(30页).pdf(30页珍藏版)》请在三个皮匠报告上搜索。
1、阿里云弹性高性能计算E-HPC何万青 博士阿里云资深专家 云之彼端,是青藏高原中国高性能计算的趋势与展望张云泉 研究员中国科学院计算技术研究所国家超级计算济南中心CCF高专委秘书长CCF大数据专委会副秘书长2016中国HPC TOP100 分析中国HPC TOP100行业应用与领域分布中国HPC TOP100应用领域及热点AWSAzureRescaleBOXX10 PFlops1 PFlops100 TFlops10 TFlops1 TFlops100 GFlops10 GFlops1 GFlops100 MFlops100 PFlops10 EFlops1 EFlops100 EFlops1
2、993201719992005201120231 ZFlops2029天气预报医疗图像基因研究预测HPC 20年:云计算推动HPC进入普惠时代2015:云计算落地2010:国家超算中心2005:集群普及2000:集群出现1995:MPP大型机高性能计算与三体智2维雕刻的9维质子超算缩回11维水星核实验核爆炸恒星模型云天明的大脑能否被智子模拟:机器学习用户声音:HPC as a Service的挑战云超算的核心是并行运算1.流场问题基于有限单元求解器2.把物理模型按区域划分为MPI计算模块3.计算与低延迟MPI同步通信保证并行效率和加速比典型HPC应用的建模和并行实现注重云上体验的高性能计算平台
3、E-HPC何以提供SLA品质的超算服务控制台CLI用户直接调用自建HPCE-HPC一键生成集群无需从0搭建SDK管控平面API网关后台主控Agent管控集群消息中间件后台数据库部署,管控,任务调度服务平面HPC Parallel Apps.应用层交互层管控层SimulationWorkflow批处理脚本数据可视化Agent域帐号服务器AgentHPC调度器运行环境开发工具应用性能分析MPI/MKL/CUDA等资源层HPC2.0数据库ECSNAS共享存储EGS并行应用:Open Source,In-house code,ISVs应用软件编译器,数学库,优化与调试工具S/W开发工具作业控制批处理,
4、调度器,集群监视,集群控制消息通信库(OpenMPI,MPI,etc)中间件节点间ROCE,20GbE内部互联CPU处理器,GPU,FPGA,SCC硬件,etc.计算节点管控,计算节点上的OS客户操作系统OpenHPC 社区阿里云E-HPC实现软硬件协同升级Skylake CPU 神龙云服务器 8xP100 GPU 50Gb RDMA 低延迟网络基于神龙服务器的超级计算集群SCC实例E-HPC计算节点推荐配置为企业提供面向大数据/AI时代的计算力阿里云E-HPC产品页:自成生态系统随公共云进化:充分释放阿里云产品性能OSS对象存储RDS数据库CDN全球网络加速VPC网络云盘NAS支持RDMA网
5、络异构设备直连支持GPU Direct支持GPU RDMA支持FPGA Direct支持FPGA Link通用计算异构计算SCCFPGAGPUASICE-HPC25g RoCE网卡生成硬件配置软件配置基础配置第1步第2步第3步三步,生成属于你的高性能计算集群以点菜方式下单生成E-HPC集群计算化学NAMD气象预报WRF生物Relion,Gromacs材料Quantum ESPRESSO分子动力LAMMPS高性能运行时库NetCDF,MPICH,OpenMPI,OpenBLAS,PETSc,Boost,FFTW,METIS 基础软件GNU(gcc,g+,gfortran),Autotools(a
6、utoconf,automake,libtool)浮点效率HPL应用测试集NPB内存带宽StreamMPI消息通讯OSU Micro-Benchmarks文件系统IOR/Iozone丰富的行业软件栈:软件规范安装 多种Linux发行版 多维度benchmark 支撑软件栈完备 支持bring-in license商业软件丰富的HPC软件生态环境应用软件的存储、安装和配置,用户登录直接可用。NAMDWRFGromacsQuantum ESPRESSOLAMMPSHPLNPBRelionNetCDFOpenBLASFF