1、 目录 封面故事封面故事 涉及数万人、历时三年,国内最大规模的云原生实践是如何打造出来的?.i 重磅访谈重磅访谈 从“幕后”走到“台前”,我们在阿里如何建设可观测体系?.1 大模型如何实际在行业落地:生成式大模型结合知识库,打造出 7*24 小时永远在线的超级员工.13 中国的“贝尔实验室”:我们的数据库从自己的第一行代码写起.31 我们不是野心家,走出大厂创业是时代使然.46 技术管理技术管理漫谈漫谈 可悲的现实,大部分技术领导者可能并不称职.60 如何为那些在裁员中幸存的人重建技术文化.74 架构师角色的演变:从发号施令到与团队合作.83 封 面 故 事 i 中国中国卓越技术卓越技术团队访
2、谈录团队访谈录2023 第第一一季季 涉及数万人、历时三年,国内最大规模的云原生实践是如何打造出来的?编辑:Tina 采访嘉宾:邹辉、于广游、王涛 云计算的竞争旷日持久,表面看来格局初定,内里却在酝酿巨变。具有先发优势的玩家,好不容易取得了看似不可撼动的地位,不曾想到有朝一日会中途被拉到同一起跑线,更换新的“CloudOS”重新出发。这个局面恐怕连Kubernetes 早期创始人都会觉得不可思议。他当初只是想改变现状,在亚马逊的主导地位下,让谷歌取得一战之力。2014 年,谷歌开源了 Kubernetes,红帽、腾讯、阿里、华为等国内外一众厂商开始力出一处,共同推进 Kubernetes 的采
3、用。2017 年底,就连亚马逊也推出了Kubernetes 产品,这也是 Kubernetes 成为标准化技术的最大信号之一。这最终改变了整个云计算。大家都开始基于 Kubernetes 技术生态去构建公有云产品,基于统一的标准以避免“深度绑定”,但这也让云原生行业严重同质化,因为各个云厂商所提供的功能和服务并没有太大的不同。对一些厂商来说,那些当年引以为豪的自研技术突破,那些树立在公司门口的纪念碑,那些专有性产品优势,都被抹平,这是一件非常残酷的事情。ii 中国中国卓越技术卓越技术团队访谈录团队访谈录2023 第第一一季季 同时这又是一些公有云厂商重塑格局的机会。锚定 Kubernetes
4、进行云原生改造,相当于给公有云更换“技术底座”,并由此构建出一些新的竞争力,从而赢取更多用户。这场技术改造,难点在哪里?对于腾讯来说,这不仅仅是一次技术“改造”,还兼带着腾讯全体系“自研业务上云”的战略任务。在谷歌 GKE 之后,腾讯云于 2017 年推出了 TKE。但腾讯云对外服务时,还是会面临客户的质疑:“为什么腾讯自己的业务没有使用腾讯公有云,是不是不敢用?”腾讯这次“云原生改造+上云”的价值就藏在客户的拷问中。腾讯在这二十年里,发展出了包括社交、音视频、游戏在内的多种业务,每种业务又都拥有海量的用户。全面上云腾讯不是第一家,但腾讯是拥有最复杂的业务场景的一家,在这个过程中,需要结合业务
5、制定各种各样的技术方案,来满足不同的业务诉求。可以理解为,每个每个业务的痛点都有局部最优解,而全面上云,则是在云上寻求通用最优解。业务的痛点都有局部最优解,而全面上云,则是在云上寻求通用最优解。如果这些痛点都能解决,那这样的云服务是足够让大家敬畏的。要运行这么多业务,云原生底座也不能有短板,必须承载得了微信、QQ、音视频、游戏等自研业务所有需求和核心能力,并最终将这些业务的技术积累和技术优势反向复制到到公有云上,展现给外部用户。除此之外,云原生改造还对组织能力提出了考验。在移动互联网时代,腾讯发展出了自己的技术哲学:每个业务都有自己的技术团队,iii 中国中国卓越技术卓越技术团队访谈录团队访谈
6、录2023 第第一一季季 每个团队都要打胜仗,这就要求“小、快、灵”,要有闭环。在自研业务上云之前,腾讯的每一个业务都有自己完整的技术栈,内部业务在一定程度上形成了“部门墙”效应。并且因为技术栈不同,员工从一个业务转岗到另一个业务,需要重新学习一遍技术,这跟换公司没什么区别。根据财报数据,腾讯员工已超十万人,其中超过 7 成是技术人员,这是一次集体向云的迁移,就像一次“搬家”,但又不仅仅是将行李打包那么简单,它是将具有一二十年历史的不同特色的多个“大建筑”,制定“平移”方案迁移到新环境中继续安然运行,难度可谓前所未有的高。考虑到花费的时间、涉及到的人员规模、技术深度,这个项目可能是在世界范围内