当前位置:首页 > 报告详情

数据中心演进:增强人工智能的信任.pdf

上传人: 明**** 编号:1011456 2025-12-21 27页 2.94MB

1、Chris VerneDirector,AI&Infrastructure,GoogleData Center EvolutionAI Model Compute ScalingExplosive growth in deployed ML capacity Increasing demand for space and powerPerformance GrowthEfficiency Growth6004002000201820202022202420262028Compute&StorageAI/MLAI power demand requires new power delivery&

2、cooling approachesGoogle Contributions to OCPMt Diablo 0.5 spec published,Enabling 1 MW rack using+/-400VdcProject Deschutes CDU 0.75 spec submitted to OCP,on the portal soon Google Contributions to OCPSolving problems together01SecurityUtilize standards,RTMs,and modularity to build secure systemsCo

3、mposable Security ArchitectureIntegrated Root of TrustCaliptra formed in 2022,led by Google,Microsoft,AMD&NVIDIADetects if SOC FW is compromised Open source HW at CHIPS Alliance;Caliptra 2.0 released with PQC Requires keys from multiple parties to unlock a storage deviceManaged using TCG Opal protoc

4、ol0.85 spec available nowImplementation part of Caliptra 2.1User 1User 2AdminLayered Open-source Cryptographic Key-managementSecurity Appraisal Framework and EnablementStandardizes security audits of HW/FW components(e.g.,xPUs,SSDs)02ResilienceHidden Enemy Silent Data CorruptionBug-free workload pro

5、duces incorrectresults without any indication2021:“Cores that dont count”2023:“Training at unprecedented scale invariably surfaces new and interesting systems failure modes”Uniting Against SDCStandard test input&output formats,part history,metrics,test framework&flowPaper to be published OCP this mo

6、nth on SDC in AIUse best practices from HPC&Cloud computing for AIDefines open research questions for academic collaborationLeveraging Learnings03Validation1.0 specs publishedEnabling TTM and higher quality GPUsReliable,Seamless GPUStandard crash dumps and deb

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
根据报告的内容,全文主要内容概括如下: - **数据中心与AI发展**:Google数据中心在AI和基础设施领域持续增长,2028年预计部署的AI/ML容量将达2000兆瓦。 - **效率与性能增长**:从2018年到2028年,计算和存储需求预计将增长600倍,同时追求效率增长。 - **Google对OCP的贡献**:Google参与OCP项目,如发布0.5和0.75规格,推动数据中心电力交付和冷却技术。 - **安全与可靠性**:Google推动安全系统构建,如Caliptra项目,用于检测安全漏洞,并实现加密密钥管理。 - **数据中心与能源**:Google在台湾建立数据中心,投资海底电缆,并利用地热和离岸风能。 - **持续投资与增长**:从2013年建立数据中心到2025年,Google在数据中心、供应链和平台工程方面持续投资和扩张。 关键点: - 2028年AI/ML容量增长600倍。 - Google推动OCP项目,发布0.5和0.75规格。 - 安全项目Caliptra,检测安全漏洞。 - 台湾数据中心,利用地热和离岸风能。 - 持续投资数据中心和供应链。
谷歌如何引领?" 规模增长背后的秘密?" 构建更安全的系统?"
客服
商务合作
小程序
服务号
折叠