1、1 1 IDC|IDC|IDC|IDC|息壤算力调度,算力随愿可得:助力工业智能开发新范式天翼云科技有限公司 吴贤维2 2 IDC|IDC|IDC|IDC|人工智能产业发展开始看重商业化进程技术突破早期商业化试点商业化范围扩大全面发展成熟数据来源:IDC整体市场CAGR(2023-2028)57.3%2028年整体市场规模达(元)1868亿算力算法数据AI人工智能商智能算力需求仍将高速增长人工智能作为数字经济的新引擎 智能算力推进人工智能应用落地3 3 IDC|IDC|IDC|IDC|强大的算网调度能力算力网关、算力插件、算数协同50家合作伙伴算力27EFLOPS自有智算35EFLOPS高效的
2、异构计算能力单集群万卡纳管和调度异构资源管理拓扑感知调度一站式的训推服务能力三步实现大模型训推全链路可观测、断点续训20个开源、4个闭源大模型引入丰富的落地应用案例公共算力服务:上海某人工智能实验室城市算力互联网:落地国内多个城市行业算力互联网:国资系统、高校算力联盟异构计算:为34个行业客户提供服务算力基础设施算间网络高速、智能、弹性自有智能算力万卡集群、两弹一优AIDC第三方智能算力多元异构、品类丰富OpenAPI统一开放平台“息壤”一体化智算平台数据生态大模型生态开源大模型自有星辰大模型第三方商业大模型SaaS千行百业AI应用生态算网调度一体化资源管理一体化训练推理一体化技术架构一体化自
3、有数据集第三方数据集开源数据集MaaSDaaSPaaSIaaS息壤一体化智算平台能力智算云能力体系天翼云作为国家云 已经越过了智能云发展的拐点4 4 IDC|IDC|IDC|IDC|北上粤浙皖绿色低碳62EFLOPS一云多态1000+280+人工智能公共算力中心内蒙、贵州、宁夏智算中心总智算规模主流GPU、NPU|公、私、边边缘节点一城一池PUE1.2总算力3.75EFlops全自研平台全国首个全液冷国产化单集群万卡公共智算中心上海万卡池PUE1.2总算力3.5EFlops全自研平台全国第二个全液冷国产化单集群万卡公共智算中心北京万卡池自建智能算力 资源丰富形态多样5 5 IDC|IDC|ID
4、C|IDC|高效异构计算能力 为万亿参数基础大模型提供高性能计算平台星辰大模型训练过程中遇到的挑战大算力挑战性能挑战稳定性挑战 单集群6000+、组网复杂、亚毫秒级响应 PB级存取,高并发、多级存储 模型文件大、存储慢、加载慢 训练有效算力低 硬件故障率高 训练故障检测难、故障恢复慢天翼云计算加速平台支撑星辰大模型高效长稳训练大算力高性能高稳定 可横向扩展的PB级HPFS 万卡二层RDMA网络 算存网综合优化,性能提升15%AI框架升级,编译效率提升200%拓扑感知调度、集合通信性能提升60%CP 30s保存、10min加载 性能持平业界 单次无中断运行155小时 训练单次中断15min恢复
5、断点续训:月级稳定运行 90%故障提前发现计算加速平台CPUGPUNPU高性能并行文件存储异步存储加速故障预测与感知自研集合通信库CTCCL拓扑感知调度加速异构资源一体化调度自研拥塞控制算法自适应路由负载均衡6 6 IDC|IDC|IDC|IDC|息壤“连、调、用”实现规模应用,向“用得好”发展实现多元算力标准化,构建算力网络供给体系公共算力服务平台用户需求意图分析策略排序成本最优性能最优综合最优质量调度成本调度性能调度定制化调度连用调通算 智算 超算 量算自建算力35EFLOPS 生态算力27EFLOPS智算算力规模62EFLOPS模型开发及应用生态首家完成DeepSeek大模型全栈国产化适
6、配的运营商算间网络算力接入异构算力封装算力加速RDMA拉远城市算力网北京、深圳、苏州、和林格尔等行业算力网央国企、高校算力联盟等智能体服务科研助手模型服务算网编排国产万卡线性加速比95%训推平台深度优化的主流大模型120款学科和专业领域22个智能体应用百余款7 7 IDC|IDC|IDC|IDC|息壤训推平台降低大模型开发门槛一站式智算服务平台,端到端覆盖大模型训推全链路产品能力国产化应用提升自研训练框架5D并行加速技术异步断点保存提升15倍性能异构混训弹性训练异构集合通信库混训效率98%弹性扩缩容训练不间断性能提升30%数据加速20%算子加速10%简单