位置:安大略省西南部
站点可靠性开发经理,零信任边界 SRE
谷歌,加拿大滑铁卢
拥有结果和决策的经验,解决模糊问题并影响利益相关者;在领域中具有深厚的专业知识。
计算机科学、相关技术领域的学士学位或同等的实际经验。
• 3 年管理人员或团队、领导项目以及设计、分析和排除分布式系统故障的经验。
• 3 年构建和开发基础设施或分布式系统的经验。
优先资格:
• 计算机科学或电气工程硕士学位或相关领域。
• 8 年数据结构和算法经验。
• 5 年分布式系统、网络和数据架构经验。
• 5 年网络安全解决方案或交付经验(例如,托管服务、威胁情报、网络咨询等)。
• 5 年云基础设施安全经验。
关于这份工作
站点可靠性开发结合了软件和系统开发,以构建和运行大规模、广泛分布、容错的系统。站点可靠性开发确保谷歌云的服务——无论是我们内部关键的还是外部可见的系统——都具有可靠性、客户需求适当的正常运行时间和快速改进的速度。此外,站点可靠性开发人员将时刻关注我们系统的容量和性能。
我们的大部分软件开发都集中在优化现有系统、构建基础设施和通过自动化消除工作。在站点可靠性开发团队中,您将有机会管理谷歌云独有的规模复杂挑战,同时运用您在编码、算法、复杂性分析和大规模系统设计方面的专业知识。站点可靠性开发的文化以求知欲、解决问题和开放性为成功的关键。
我们的组织汇集了来自各种背景、经验和观点的人。我们鼓励他们在无责备的环境中合作、放眼大局并承担风险。我们提倡自主工作于有意义的项目,同时我们也努力创造一个提供学习和成长所需支持和指导的环境。
站点可靠性开发团队负责在零信任环境(例如,客户端设备、公司、生产、云、谷歌云专用(TPC))中实施安全边界的基础设施。
在这个角色中,您将成为我们任务的一部分,默认情况下为谷歌及其用户、客户、合作伙伴和第三方扩展上下文感知的访问保护。
用户在线上看到的一切背后都是由技术基础设施团队构建的架构以保持其运行。从开发和维护我们的数据中心到构建下一代谷歌平台,我们使谷歌的产品组合成为可能。我们为成为工程师的工程师而自豪,并热衷于拆解事物以便重新构建。我们保持网络的正常运行,确保用户获得最佳和最快的体验。
在加拿大,这个全职职位的基本工资范围为 CAD ,000 + 奖金 + 股权 + 福利。我们的薪资范围由角色、级别和地点决定。在范围内,个人薪酬由工作地点和其他因素决定,包括与工作相关的技能、经验和相关教育或培训。
请注意,加拿大职位发布中列出的薪酬详情仅反映基本工资,不包括奖金、股权或福利。了解更多关于谷歌的福利。
职责
• 拥有关键服务的可用性和性能,并构建自动化以防止问题再次发生。自动响应所有非异常服务条件。
• 以身作则,指导团队,并通过高质量的技术执行建立信誉。
• 使用跟随太阳模型管理跨大陆的值班轮换。
• 设计、编写和交付软件以提高谷歌的可用性、可扩展性、延迟和效率。