最低资格:
• 计算机科学、相关领域的学士学位或同等的实践经验。
• 在一种或多种编程语言中拥有5年的软件开发经验。
• 拥有5年的数据结构或算法经验。
• 在设计、分析和故障排除大规模分布式系统方面拥有3年的经验,并且在领导项目和提供技术领导方面有2年的经验。
优先资格:
• 计算机科学或工程的硕士学位。
关于该职位
站点可靠性工程(SRE)结合了软件和系统工程,以构建和运行大规模、分布式、容错的系统。SRE确保谷歌云的服务——无论是我们内部关键的还是外部可见的系统——具备可靠性、满足客户需求的正常运行时间以及快速的改进速度。此外,SRE还会密切关注我们系统的容量和性能。
我们的大部分软件开发工作集中在优化现有系统、构建基础设施和通过自动化消除工作。在SRE团队中,您将有机会管理独特于谷歌云的规模复杂挑战,同时利用您在编码、算法、复杂性分析和大规模系统设计方面的专业知识。SRE的多样性、智力好奇心、解决问题和开放的文化是其成功的关键。我们的组织汇聚了各种背景、经验和观点的人。我们鼓励他们在无责备的环境中合作、思考大局并冒险。我们提倡自我导向,致力于有意义的项目,同时努力创造一个提供学习和成长所需支持与指导的环境。
在用户在线看到的一切背后,是技术基础设施团队构建的架构,以保持其运行。从开发和维护我们的数据中心到构建下一代谷歌平台,我们使谷歌的产品组合成为可能。我们为成为工程师的工程师而感到自豪,喜欢通过拆解事物来使保修失效,以便我们能够重新构建它们。我们保持网络的正常运行,确保用户获得最佳和最快的体验。
该全职职位在美国的基本工资范围为$161,000-$239,000,包括奖金、股权和福利。我们的薪资范围由角色、级别和地点决定。每个职位发布中显示的范围反映了该职位在所有美国地点的最低和最高目标薪资。在这个范围内,个人薪酬由工作地点和其他因素决定,包括与工作相关的技能、经验以及相关的教育或培训。您的招聘人员可以在招聘过程中分享您首选地点的具体薪资范围。
请注意,美国职位发布中列出的薪酬细节仅反映基本工资,不包括奖金、股权或福利。了解更多关于谷歌的福利。
职责
• 参与并改善服务的整个生命周期——从构思和设计,到部署、操作和优化。
• 在服务上线之前,通过系统设计咨询、开发软件平台和框架、容量规划和上线评审等活动支持服务。
• 一旦服务上线,通过测量和监控可用性、延迟和整体系统健康状况来维护服务。
• 通过自动化等机制可持续地扩展系统,并通过推动改进可靠性和速度的变更来发展系统。
• 实践可持续的事件响应和无责备的事后分析。