1、1英特尔中国科学计算实战手册趋势篇英特尔中国科学计算实战手册32英特尔中国科学计算实战手册趋势篇英特尔中国科学计算实战手册趋势篇应用实践中的科学计算平台应用于 CAE 仿真分析的科学计算平台 CAE 仿真分析技术 面向仿真分析软件的英特尔优化应用于分子动力学的科学计算平台 分子动力学技术 面向英特尔 架构平台的分子动力学软件优化Linpack 基准性能测试英特尔 发行版 Linpack 基准性能测试英特尔 发行版简介 配置 Linpack 英特尔 发行版 运行 Linpack 英特尔 发行版 Linpack 英特尔 发行版对异构计算平台的支持 提升运行性能 面向英特尔 至强 CPU Max 系
2、列处理器的运行应用于生命科学的科学计算平台 生命科学与高性能的科学计算平台 面向英特尔 架构平台的生命科学软件优化面向英特尔 至强 CPU Max 系列处理器的配置和调优 全局优化配置“仅 HBM”与“HBM 缓存”内存模式下优化配置“HBM Flat”内存模式下优化配置面向英特尔 架构优化的 HPCG 基准测试 面向英特尔 架构优化的 HPCG 基准测试简介 使用面向英特尔 架构优化的 HPCG 基准测试 选择最佳参数配置和 Problem Sizes 面向英特尔 至强 CPU Max 系列处理器的运行面向英特尔 架构平台编译并运行的 Stream 基准测试 编译前准备 编译 Stream
3、基准测试 运行 Stream 基准测试 面向英特尔 至强 CPU Max 系列处理器的运行第四代英特尔 至强 可扩展处理器英特尔 至强 CPU Max 系列英特尔 高级矢量扩展 512(英特尔 AVX-512)英特尔 oneAPI 工具套件英特尔 MPI 库英特尔 oneAPI 数学内核库(oneMKL)基于 LLVM 的英特尔 编译器英特尔 oneAPI DPC+/C+编译器英特尔 Fortran 编译器英特尔 vTune Profiler英特尔 Trace Analyzer and Collector(ITAC)目 录Contents04趋势篇应用优化实战篇基准测试实战篇081011111
4、81919404041414242432728283536363744444545454646464747产品技术篇505253545556565758585954英特尔中国科学计算实战手册趋势篇英特尔中国科学计算实战手册趋势篇趋势篇0504今天,在科学研究和技术实践各领域,以计算机和智能为代表的信息技术已成为加速创新的关键力量,作为现代科技三大支柱之一的科学计算,更是在其中发挥着无可替代的作用。尤其是一些领域,随着科学研究的深入,需要处理的数据量越来越大,算法也日益复杂,需要计算机系统大幅提高性能、加快处理速度来予以支撑。例如,在流体力学领域,一些仿真模拟场景中所需处理的网格动辄数以亿计;在
5、气象预测领域,气象机构每年从卫星、飞机或观测站等获取的气象数据多达 PB 级别。在其它如天文、生命科学等领域同样如此,大规模方程计算和海量数据处理,虽然为探索未知开辟着新路径,但其计算过程就犹如黑洞一般会大幅榨取计算资源,让运算变得异常困难,也带来了巨大的成本。在技术的落地实践、工程实现阶段,这一现象就更为突出。例如在制造行业,在设计研发阶段开展高精度的仿真模拟,不仅能大幅降低物理原型/实验的数量和成本,还能提高设计质量和效率,缩短新品研发上市时间,进而提升竞争力。但实施大规模仿真任务,往往需要数天乃至以周计才能完成,中间还可能还会因基础设施性能不足(例如内存带宽性能不足等)而中断,无法获得预
6、期的效果。为应对上述挑战,拥有更强性能的科学计算平台正应运而生且不断迭代进化,除了拥有比普通计算机系统更强的计算、存储和 IO 等基础能力,以及操作系统、驱动程序、文件系统、编译器和应用软件支持外,它还需要依托并行性(同时处理多项任务)和分布式(在多个节点处理任务)特性来实现更大规模的算力部署,以及计算的高效率和运行中的高稳定性。2023 年 6 月 25 日,英特尔宣布,Aurora 超级计算机在阿贡国家实验室完成部署,这成为全球首台峰值性能超过 2 Exaflops(1 Exaflops=100 亿亿次浮点指令/秒)算力的超级计算机1。基因测序等工程探索,科学计算平台都正帮助人们加速科学发