《网易游戏机器学习云平台助力AI应用落地实践.pdf》由会员分享,可在线阅读,更多相关《网易游戏机器学习云平台助力AI应用落地实践.pdf(22页珍藏版)》请在三个皮匠报告上搜索。
1、网易游戏机器学习云平台助力AI应用落地实践张翔网易互娱AI技术设施平台负责人Contents目录01Tmax AI机器学习平台简介02如何基于Tmax平台构建AI画图应用03多模型AI应用的优化Tmax AI机器学习平台简介一站式AI工作流体验灵活的资源调度Flexible resource scheduling.高效的AI开发工作效率Efficient AI development work efficiency易托管的AI服务Operable and maintainable AI servicesTmax平台做了什么New Future on CloudTmax平台功能架构数据卷管理数据
2、管理可视化控制台、API、CLI数据权限数据集管理数据处理JupyterLab模型开发可视化建模自定义镜像预置镜像模型训练任务管理模型管理强化学习CPU/GPU分布式训练模型部署服务监控弹性伸缩蓝绿部署资源调度系统服务运维/运营服务权限计费模块可视化控制台、API、CLITFS文件管理系统自有GPU&云上GPU&GDC大数据集群Kubernetes调度镜像仓库ChubaoFS挂载Tmax平台技术架构镜像仓库交互式建模Jupyter拖曳式建模Studio模型训练AI模型管理服务部署ChubaoFS挂载Notebook-ControllerPipeline-ServiceGdcJob-Contro
3、llerMPIjob-ControllerTFJob-ControllerPytorchJob-ControllerML-metadateServiceKFServer-Controller开发实例容器算子实例容器训练实例容器推理实例容器CFS存储GDC大数据集群平台层各类接口控制层K8S CRDController计算资源池CPU/GPU分布式存储如何基于Tmax平台构建AI画图应用New Future on Cloud低成本支持大量用户Convergence of IT Infrastructure低门槛使用AI绘画能力Online Presence of Core Technologie
4、s利用AIGC提升生产效率Data and Intelligence Capabilities of Business Applications低成本高性能高可用敏捷创新快数字化转型的最短路径生成式AI绘画的目标AI美术生产平台产品介绍AI美术生产平台是基于开源模型 Stable Diffusion 的云端一站式美术生产平台,为美术创作者供提供完整的 AI 绘图服务,经过我们的持续建设,使得美术 AI 创作更简单、更高效、更安全!AI美术生产平台产品优势 无需安装部署,开箱即用 无需购置显卡,成本更优 相比开源模型,性能更强 数据权限管控,保障资产安全 支持团队管理和协作,更高效 支持API调
5、用,可扩展性高网易游戏美术经验弹性算力&智能调度AI 模型训练AI 绘图生产AI 资产管理API模型算力AI美术生产平台功能架构图文生图创作平台AI绘画应用功能架构图生图AI高清放大AI抠图自研文件存储Tmax机器学习平台&AILAB算法支持高清修复图像反推文本PoseX其他AI插件模型管理资产管理Prompt管理AI出图管理训练集管理管线流程管理一键训练训练平台支持ckpt,lora模型测试评估自动化训练中间结果模型存储、效果预览AI流程工具(裁剪、标注等)低代码拖拽DMFlow自动批量运行自定义开发节点流程云端共享预置大量图像处理节点云端大规模算力低代码开发定制化AI算法监控报警 运行日志
6、用户使用 数据统计基于混合云架构的算力池K8S控制面镜像仓库同步模型数据同步 多地域弹性资源池:解决GPU算力资源缺口的提供较好的弹性能力 统一业务发布体验:一套deployment发布至一个虚拟集群,即可完成多region发布;统一控制面:在一个集群内管理多region节点管控,支持万级节点管控;ACK-Fluid数据缓存杭州regionACKACR镜像仓库ACK OneACK-Fluid数据缓存杭州regionACKACR镜像仓库NCR镜像仓库CubeFSTMAX-IDC集群杭州IDC基于Knative服务网格的后端架构多region请求调度问题;请