《2018年阿里云高性能计算在制造业的应用.pdf》由会员分享,可在线阅读,更多相关《2018年阿里云高性能计算在制造业的应用.pdf(26页珍藏版)》请在三个皮匠报告上搜索。
1、阿里云高性能计算在制造业的应用智能制造专场背景HPC方案相关产品解析EDA场景10 PFlops10 PFlops1 PFlops1 PFlops100 TFlops100 TFlops10 TFlops10 TFlops1 TFlops1 TFlops100 GFlops100 GFlops10 GFlops10 GFlops1 GFlops1 GFlops100 MFlops100 MFlops100 PFlops100 PFlops10 EFlops10 EFlops1 EFlops1 EFlops100 EFlops100 EFlops1993199320172017199919992
2、005200520112011202320231 ZFlops1 ZFlops20292029天气预报天气预报医疗图像医疗图像基因研究基因研究预测预测HPC 20年:云计算推动HPC进入普惠时代2015:2015:云计算落地云计算落地2010:2010:国家超算中心国家超算中心2005:2005:集群普及集群普及2000:2000:集群出现集群出现1995:MPP1995:MPP大型机大型机客户声音:HPCaaS的挑战云超算 vs.超算云?1.1.流场问题基于有限单元求解器流场问题基于有限单元求解器2.2.把物理模型按区域划分为把物理模型按区域划分为MPIMPI计算模块计算模块3.3.计算与低
3、延迟计算与低延迟MPIMPI同步通信保证并行效率和加速比同步通信保证并行效率和加速比典型典型HPCHPC应用的建模和并行实现应用的建模和并行实现主节点主节点+登陆节点登陆节点 任务调度任务调度 集群监控集群监控 集群报告集群报告 用户账户管理用户账户管理 预处理预处理+后处理应用后处理应用 NFSNFS导出到计算节点的外挂存储导出到计算节点的外挂存储计算节点计算节点 2 2路,路,4 4路,刀片路,刀片 GPUGPUXeon Phi Xeon Phi 加速卡加速卡 单路单路KNLKNL高密度节点高密度节点集群网络集群网络 TCPTCPRDMARDMAIBIB 管理,计算,存储三套网络管理,计算
4、,存储三套网络集群存储集群存储 NFSNFS 分布式并行文件系统分布式并行文件系统 LustreLustreGPFS/GPFS/PanasasPanasas典型典型HPCHPC集群集群的的架构组成架构组成ECS弹性裸金属服务器,SCC+GPUIB vs.RoCEVPCNAS or.Lustre超算&AI系统软件架构应用性能特征要求:HPC/AI/Bigdata?对外服务框架虚拟化2.0自动运维&伸缩EHPC PAASAI framework云平台云平台软件软件硬件硬件云超算技术、产品、方案E E-HPCHPC作为阿里云产品家族新成员作为阿里云产品家族新成员ConsoleCLIUsers Int
5、erface自建自建HPCHPCE E-HPCHPCFrom 0 to 1SDK管控平面API Gatewaybackend controlAgent control clusterMessage MiddlewareBackend DB部署,管控,任务调度服务平面HPC Parallel Apps.ApplicationsSaaSRMSimulationWorkflowBatch computeData visualizationAgentDomain ID serverAgentHPC Job schedulerRuntimeDeveloper ToolchainPerformance w
6、izardMPI/MKL/CUDA libs.IaaS layerSCCDBECSNAS parallel storageEGSOpen Source,In-house code,ISVs AppsApplicationsCompiler,Vtune,MPI,S/WDeveloper ToolsJob SchedulerSLURM,PBS Pro,PlatformOpenMPI,MPI,etc)Middle WareIB,ROCE,20GbEInterconnectCPU,GPU,FPGA,etc.Compute NodesResource manage