《中科院软件所副所长和总工程师武延军研究员:“AI大模型时代下的操作系统发展思考”.pdf》由会员分享,可在线阅读,更多相关《中科院软件所副所长和总工程师武延军研究员:“AI大模型时代下的操作系统发展思考”.pdf(31页珍藏版)》请在三个皮匠报告上搜索。
1、AI 大(语言)模型时代下的操作系统发展思考 报告人:武延军中国科学院软件研究所2024-08-20 杭州AI大(语言)模型正在成为操作系统领域热点话题传统操作系统 VS“LLM OS”VS“操作系统”在大众媒介中的概念泛化流浪地球2剧照操作系统的定义和分类 定义:操作系统是这样一种系统软件,它管理计算机硬件和软件资源,进行抽象,为计算机程序提供服务。常见的分类:嵌入式操作系统/实时系统 单机系统/桌面/移动终端操作系统 集群操作系统/分布式操作系统https:/upload.wikimedia.org/wikipedia/commons/thumb/e/e1/Operating_system
2、_placement.svg/330px-Operating_system_placement.svg.png操作系统是IT生态的“粘合剂”和“倍增器”内核设备开发者硬件公司运行环境基础库编程语言集成开发环境编译工具链50亿手机30亿PC10亿服务器100亿可穿戴设备1万亿物联网终端1千万APP1百万组织数万家半导体/设备企业1亿开发者10010000VS.11万100万VS.1*以上数字均为粗略估算的概数单机操作系统的发展历程https:/www.orb- CPU处理器速度成倍提升 专用图形显示设备(GPU)存储空间更大,大数据成为可能 电路体积减少,嵌入更多场景 交互形式引发的操作系统革新
3、 按钮+穿孔卡 键盘+鼠标 高分辨率触摸屏 LLM 使得对话式界面(CUI)更有前景 更远未来:神经直接连接?仿古的PDP11设备。背后是个树莓派过去几十年操作系统的变革:数据和算力规模跃升 如何用最低成本响应处理海量并发请求:Linux集群 如何提高数十万普通Linux服务器的利用率:云计算/租赁 如何安全的进行云计算:硬件虚拟化技术(VT)如何更安全的保证数据:硬件支持的机密计算(TEE、SGX)如何方便地运维数千个相互依赖的服务:容器化、CI/CD等 如何更快的进行网络数据处理:DPDK、EBPF等 如何在云端更快、成本更低的为AI应用提供算力:GPGPU、TPU、FPGA等 如何在本地
4、更好的加速AI推理:异构架构、NPU、RISC-V等过去二十年信息产业的宏观趋势“物理墙”+算力需求指数增加=DSA成为主流趋势软件规模和复杂度超线性增长有能力驾驭复杂度的程序员数量有限程序员数量有限:开源成为主流,能否聚集足够开发者是生死分界线https:/ as OS 视角视角1:LLM as OS用户&体验智能应用LLM as OS处理器内存存储外设用户 prompt#1 大量概念(实时、可抢占、IPC、系统调用等)将被重新定义#2 所有应用都需要重写#3 超级应用(类似微信、ChatGPT等)与OS的边界需要重新界定LLM as OS 视角:仍然存在各种局限 基础原理是统计学上的函数拟
5、合,无法总结出自然定律 无法用于需要强逻辑推断场景 拟合参数已经远超人类理解极限,无法验证准确性和鲁棒性 输入上的细微修改有可能引起输出未期待的的巨大变化(衍生出新的安全攻击新门类)错误复现难度和可调试性有待确认,可修复性待确认 修复后回归测试的工程量和难度未知 Next-Token 模式在操作系统中使用场景有限 目前关于AI模型用于操作系统的观点多数是从用户交互角度出发 算力需求高(云端 vs 本地)与物理世界交互的操作系统场景有着极高的实时性和功能安全性要求软件规模和复杂度超线性增长:LLM in OS 视角视角2:LLM in OS用户&体验传统应用LLM in OS处理器内存存储外设用
6、户prompt智能应用POSIX 接口POSIX-AI 接口融合调度、融合内存管理、融合存储管理#1 操作系统的大量硬编码参数将被模型推理替代(例如通过 Kconfig/eBPF等)。#2 新的POSIX API将诞生,以适应智能应用的编程范式。#3 实时与非实时场景共存,将带来更复杂的调度、内存、存储管理策略。LLM in OS 视角:可以帮助操作系统变得更先进 手机语音助手:已经在特定交互场景取得巨大成功 作为辅助操作系统开发者的外脑“人无法阅读上亿行Linux内核代码变更历史;但是AI可以。”操作系统用户的行为感知、预测与优化“人无法长时间统计应用启动规律和资源消耗区间;但是AI可以。”