我的客户是一家全球对冲基金,正在积极寻找一名技术娴熟且积极主动的SRE加入他们的团队。作为SRE,您将在推动组织内站点可靠性工程实践的采用中发挥关键作用。理想的候选人应具备强大的技术背景,并对推动运营效率和持续改进充满热情。
职位职责:
- 推动SRE原则、方法和最佳实践在整个组织中的采用。
- 与应用开发团队密切合作,确保应用程序的成功部署和运行,包括开发期间的早期支持。
- 建立和监控关键指标、性能指标和服务水平目标(SLO),以确保关键系统的可靠性和可用性。
- 通过自动化、代码改进和流程优化识别消除繁琐工作的机会。
- 对系统故障和事件进行根本原因分析,并实施工程解决方案以防止未来发生。
- 领导事件管理和解决工作,确保及时有效地响应事件,并推动事后审查和流程改进。
- 与基础设施、网络和安全等跨职能团队密切合作,以优化系统性能、可扩展性和安全性。
- 与利益相关者合作定义和完善服务水平协议(SLA)和运营要求。
- 了解站点可靠性工程的行业趋势和新兴技术,并利用它们推动创新和提高运营效率。
您需要具备:
- 计算机科学、工程或相关领域的学士或硕士学位。
- 在站点可靠性工程或相关领域有丰富经验,对SRE原则、实践和工具有深入了解。
- 具备分布式系统、云计算、网络架构和软件开发等领域的技术专长。
- 具有丰富的Python经验,以及自动化和配置管理工具的经验。
- 对监控和可观察性框架、事件管理和事后分析有扎实的理解。
- 优秀的问题解决和故障排除能力,能够分析复杂系统并识别改进领域。
- 强大的领导能力,能够激励和激励团队,并培养协作、创新和持续改进的文化。
- 出色的沟通和人际交往能力,能够有效地向技术和非技术利益相关者传达技术概念。
- 在金融行业或对冲基金环境中有经验者优先。
职位优势:
- 极具竞争力的薪酬和医疗福利
- 能为您未来的职业生涯打开大门的知名品牌
- 许多内部流动和长期职业发展的机会