当前位置:首页 > 报告详情

17决策智能.pdf

上传人: 会*** 编号:111445 2023-01-03 54页 3.83MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了启元世界技术副总裁高超在2020北京智源大会上关于《启元星际指挥官:基于高效平台训练的最高级强化学习智能体》的报告。报告从三个方面展开: 1. 启元星际指挥官达到职业玩家水平的技术要点。启元世界从2017年开始基于星际争霸的环境研究强化学习技术,启元星际指挥官通过模仿学习、强化学习、演化学习三位一体的训练流程,以及启元世界自主设计的网络模型Commander Neural Network,实现了对星际争霸游戏的职业玩家水平。 2. 启元世界强化学习平台的设计要点。启元世界强化学习平台通过硬件架构的设计,提供了高计算密度、低通信延时的集群部署方案。通过分布式操作系统层的抽象,将众多服务器抽象成如同一台电脑的、可灵活分配的算力模型。最后通过四大引擎的计算抽象,将大规模算力转化为数据生产和消费的能力,从而简化了大规模算法的实施成本。 3. 启元世界强化学习平台与产业的结合点。启元世界依托于成熟的平台技术,凭借高强度的计算性能、大规模生产问题的算法能力、低成本的算法实施方案,可以将强化学习技术应用于诸多行业,如智慧防务、数字娱乐、金融科技等。
星际争霸AI如何达到职业玩家水平? 启元世界强化学习平台的设计要点是什么? 启元世界如何将强化学习技术应用于行业?
客服
商务合作
小程序
服务号
折叠