《多元CPU性能调优技术挑战、产品设计和业务实践_0413_V2.pdf》由会员分享,可在线阅读,更多相关《多元CPU性能调优技术挑战、产品设计和业务实践_0413_V2.pdf(34页珍藏版)》请在三个皮匠报告上搜索。
1、百度智能云资深研发工程师 刘星星多元多元CPUCPU性能调优性能调优技术挑战技术挑战、产品设计和业务实践产品设计和业务实践多元多元CPUCPU性能调优的技术挑战性能调优的技术挑战0 01 1BtuneBtune一键调优的一键调优的产品设计方案产品设计方案0 02 2百度智能云的调优实践百度智能云的调优实践0 03 3服务器服务器CPUCPU发展历史和趋势发展历史和趋势服务器CPU近几年呈现多元化发展趋势,AMD和ARM以多核、低功耗、先进制程工艺等优势相继异军突起2012 2012 20162016 Intel一家独大,无挑战者,“挤牙膏”策略,CPU性能增长缓慢2017 20202017 2
2、020 AMD异军突起,Zen core+多die架构+先进工艺,CPU性能大幅提升 ARM崭露头角2021 2024+2021 2024+ARM异军突起:全新core+多核+低功耗优势,成为新选择IntelIntelAMDAMDARMARM代号:SP系列,Skylake CLX工艺:14 14nmTDP:105 165W核数:14 24频率:2.7 3.1GHz代号:鲲鹏916 920工艺:14 7nmTDP:75 150W核数:32 48频率:2.5 2.6GHz代号:Icelake GNR-AP工艺:10 7nmTDP:240 500W核数:32 120频率:3.1 3.2GHz代号:M
3、ilan Turin工艺:7 5nmTDP:280 450W核数:64 160频率:3.2 3.3GHz代号:E5系列,v1 v4工艺:32 14nmTDP:95 105W核数:8 12频率:2.3 2.5GHz代号:Naples Rome工艺:14 7nmTDP:155 280W核数:16 64频率:2.9 3.1GHz代号:Ampere,Altra OneX工艺:7 5nmTDP:210 350W核数:80 192频率:3.0 3.0GHzAMD AMD 发布发布AMD AMD 发布发布AMD AMD 发布发布AMD AMD 发布发布Ampere Ampere 发布发布Ampere Amp
4、ere 发布发布Ampere Ampere 发布发布AMDAMDARMARM20182018亚洲首家亚洲首家大规模试点,落地数据库等存储场景20192019百度智能云上线AMD机型,对外提供服务20202020落地计算场景,规模上规模上万台,国内万台,国内TOP3TOP3,大幅降低业务成本20212021MILAN处理器被集团内外部大客户广泛应用大客户广泛应用20232023Genoa陆续上量,支持各类业务场景2022H12022H1在百度内部通用计算场景大规模上线大规模上线2022H22022H2发布ARM BCC/BBC计算实例20242024在智驾仿真场景规模上线百度内部百度内部CPUC
5、PU部署情况部署情况从2017年至今,百度先后引入4 4代代AMD服务器从2022年至今,百度先后引入2 2代代ARM服务器20232023国内首次发布ARM虚拟硬件产品AVHCoreCore架构差异带来的性能问题和挑战架构差异带来的性能问题和挑战影响影响CPUCPU性能的不只是频率和核数,还有指令和微架构性能的不只是频率和核数,还有指令和微架构INTELINTEL:Ice Lake开始支持AVX512AMDAMD:AVX256,Zen4开始支持AVX512AmpereAmpere:Neon 128*2SIMDSIMD指令指令Intel AVX-512并行指令位宽更大,但降频比AMD更严重Am
6、pere位宽更小,在并行向量计算场景中处于弱势INTELINTEL:Ice Lake开始支持FP16,Cooper Lake开始支持BF16AMDAMD:Milan开始支持BF16,不支持FP16AmpereAmpere:FP32/FP16浮点浮点指令指令在不支持FP16的Intel和AMD等老平台,FP16推理性能不好INTELINTEL:全core boost,频率可以稳定boost到最大,支持HTAMDAMD:单core boost,最大频率boost频率不保证,支持HTAmpereAmpere:频率固定,不支持HT频率与频率与HTHTAmpere是独立物理核,单核性能更好更稳定,多核场