什么是站点可靠性工程 (SRE)?网站可靠性工程(SRE)概念起源于谷歌。这个想法与DevOps的原则密切相关。这是一种 IT 运维方法。SRE 团队使用该软件来管理系统、解决问题和自动执行操作任务。SRE 团队承担 IT 运营团队已完成的任务(通常是手动的),而是将其交给使用工具和自动化来解决问题和管理生产系统的工程师或运维团队。在创建可扩展且高度可靠的软件系统时,这是一种有价值的做法。它通过代码帮助组织管理大型基础设施,这对于管理数十万台计算机的系统管理员来说更具可扩展性和可持续性。为什么我们需要 SRE?重要吗?是什么造就了一支优秀的 SRE 团队?SRE就像软件工程和IT运营之间...