1、腾讯”开悟AI平台在TensorRT上的最佳实践腾讯AILab朱文熙Tencent腾讯#page#目录1.开悟平台背景介绍2.强化学习训练中的推理3.TensorRT最佳实践4.总结Tencent腾讯!#page#背景:游戏+AI开启人工智能的热潮业界对游戏AI的探索2017.082016.032019.012019.042019.072019.08ScienceOpenATFiveSUPHXDeepMind: AlphagoCMU+Facebook:德州OpenAl:Dota2DeepMind: StarCraftllOpenAl:Dota2Microsoft:麻将战胜李世石1V1对战职业选
2、手5V5战胜世界冠军OG六人桌战胜职业选手挑战职业选手天凤平台到十段游戏模拟环境作为人工智能的研究验证环境,已形成广泛共识,腾讯AILab对游戏AI的探索2018.122019.82017.032017.042016.01开始王者荣耀AI绝悟的研开始围棋AI绝艺的以绝艺身份亮相以绝悟身份亮相王者世界冠军杯究研究获得UEC冠军战胜主播队战胜职业联队2FINE绝格PRTTencent腾讯!#page#开悟平台核心功能:全栈打通的AI+游戏实验平台开悟的核心功能:聚焦于王者荣耀这一款国民级游戏,将为AI研究者提供算法、数据(脱敏)、计算平台等多种资源服务支持综合服务匿名的计算平台eee游戏数据集发装
3、评估工具开悟可为有需求的学术开悟网站平台灵活易用,开悟目前已包含采集自核心集群界研究者提供计算平台与算包括强化训练、数据抽取、开悟已提供游戏对战工王者荣耀游戏的10+万开悟已提供用于读取力资源,这些资源基于腾讯监督训练、推理服务、对战具和对局录像回放工具,这局真实对战数据,包括游戏王者荣耀游戏场景和控公司的云计算与大数据处理管理、录像管理、入门指引些工具基于Linux环境,让场景数据与执行指令数据;制英雄行为的数据接口平台,可用于训练强化学习七大板块,能为研究者优质研究者可以在开发过程中轻该数据集已经过置名化处理GamecoreAPI,让研究者可和模仿学习算法和模型高效的辅助管理服务。松调试,
4、即时有效地评估新未来还将继续扩充。以快速便捷地测试自己的新算法和模型的性能表现。算法和模型Tencent腾讯#page#开悟平台2020年进展:提高研发效率,加强与高校之间的合作对内:实验成本降低50%,研发效率提30%对外:为17所高校提供王者研究环境官网:http:/普通览家工具A法分开悟第一届开悟“Hl+游戏”高校大赛初赛启动腾讯开悟平台首次面向高校开放D王者荣全球首个在MOBA类游戏做到全英雄职业水平的Al王者监督学习实验时长:39h-4h王者强化学习实验时长:14天-5天Tencent腾讯!#page#目录1.开悟平台背景介绍2.强化学习训练中的推理3.TensorRT最佳实践4.总
5、结Tencent腾讯!#page#王者荣耀”绝悟”AITencent腾讯!#page#强化学习训练过程中推理推理自对弃多机多卡强化训练framestatPolicya方update(a)esamplesactionagent样本池训练服务参数凡模型actionagent样本池训练服务发换2gamecore样本池训练服务Policy对手TRT(a)framestaterefit模型池P2P模型同步推理GPU1对局1训练GPU1推理GPU2对局2训练GPU2推理GPU.对局.训练GPU.Tencent 腾讯#page#目录1.开悟平台背景介绍2.强化学习训练中的推理3.TensorRT最佳实践。R
6、efit优化。图优化。低效Op的改造新Op支持4.总结Tencent腾讯!#page#TensorRT WorkflowrBuilderGraphKernelMemorySerializeLoad PluginoptimizationautotuningoptimizationengineRuntimeInferenceLoad plugin &Process outputPrepare inputDeserialize engine(execute ops)Refit(prepare weight)Tencent腾讯#page#Refit-减少TRTrebuild开销引入Refit功能TRT