《澎峰科技:PerfMPL白皮书(10页).pdf》由会员分享,可在线阅读,更多相关《澎峰科技:PerfMPL白皮书(10页).pdf(10页珍藏版)》请在三个皮匠报告上搜索。
1、PerfXLab 澎峰科技 1 A Technical overview of PerfMPL(Math Performance Library)文档版本:V1.0 发布日期:2022/8/30 PerfMPL What is this?PerfXLab 澎峰科技 2 目 录 介绍.3 什么是 PerfMPL.3 法律信息.3 PerfMPL overview.4 PerfMPL for 通用算力.6 PerfMPL for 专用算力.8 实现生态共赢,开启算力时代.10 PerfXLab 澎峰科技 3 介绍介绍 数学函数库作为离硬件最近的软件,是硬件算力得以充分发挥的保障,也是硬件和应用的唯
2、一桥梁。所以数学函数库在科学计算、工程计算、AI 计算等各领域一直发挥着重要作用。在过去和未来,伴随计算机体系结构的不断发展、前沿科技探索不断取得突破性进展以及应用领域的不断拓展,整个计算技术行业对于数学函数库的优化也从未停止。随着异构计算和多样化算力的兴起,一个可跨平台移植的高性能数学函数库在计算技术领域将越来越重要。本文件旨在对澎峰科技研发的数学函数库 PerfMPL进行介绍性技术概述。什么是什么是 PerfMPLPerfMPL PerfMPL(Math Performance Library)是一套针对计算机的各类指令集处理器和各领域应用程序经过高度优化的数学计算库。PerfMPL自带强
3、大的包管理能力,所以它既可以作为 x86、ARM、RISC-V 等指令集 CPU 平台的通用数学函数库基础软件,也可以作为各类 DSA 加速硬件满足各种应用场景所必须支持的基础软件,最终成为各领域应用程序(如 AI、CAE、EDA、信号处理等)的依赖数学计算库。法律信息法律信息 版权所有 澎峰(北京)科技有限公司 2022 年。保留一切权利。非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。商标声明 PerfMPL为澎峰(北京)科技有限公司公司的商标。本文档所提及的其他所有商标或注册商标,由各自的所有人拥有。澎峰科技 地址:北京市海淀区紫雀路 5
4、5 号院 9 号楼翠湖科创平台 304 室 邮箱: 中文网址:, PerfXLab 澎峰科技 4 PerfMPLPerfMPL overviewoverview 张先轶(中科院博士)于 2011 年发起 OpenBLAS 开源项目,OpenBLAS 是一个优化的 BLAS 库(http:/),被广泛应用于科学计算、数据分析、深度学习算法、人工智能等领域,被 Caffe、MXNet、Julia、Ubuntu、Debian、openSUSE、GNU Octave 等知名项目集成;OpenBLAS 也被用作为各种处理器系统开发包的基础软件之一。PerfMPL 是以 OpenBLAS 为发展基础,经过
5、多年发展逐步覆盖至 FFT(快速傅立叶变换)、SPARSE(稀疏矩阵计算库)、MATH(基础数学库)、VML(Vector Math Library 向量数学库)、DNN(Deep Neural Networks 深度神经网络)、PerfIPP(图像处理等)等计算库。PerfMPL 基于澎峰科技拥有自主知识产权的统一数学函数库技术积累,通过针对性优化、完善、裁剪等方式,发展出两大分支版本:1.PerfMPL for 通用算力,主要面向 CPU 指令集。2.PerfMPL for 专用算力,主要面向 GPU、NPU、ASIC、FPGA 和各类 DSA。通常而言,因为 CPU 的体系结构决定了其计
6、算通用性强,所以“PerfMPL for 通用算力”软件发行版本支持的数学库最为全面。如下以此版本为例,介绍 PerfMPL 包括的所有核心函数库。序序号号 库名库名 描述描述 适用场景适用场景 1 OpenBLAS/PerfBLAS 基础线性代数运算数学库(Basic Linear Algebra Subprograms)LAPACK 模块 向量-向量运算 向量-矩阵运算 矩阵-矩阵运算 稠密线性方程组求解 特征值求解 2 PerfFFT 快速傅里叶(Fast Fourier Transform)运算库,是快速计算序列的离散傅里叶变换(DFT)或其逆变换的方法,广泛的应用于工程、科学和数学领