高级站点可靠性工程师,后端(可靠性工程)

蒙特利尔 7天前全职 网络
面议
概述 Affirm正在重新定义信用,使其更加诚实和友好,为消费者提供灵活性,让他们可以先购买后付款,无需任何隐藏费用或复利。 职责 职责 • Affirm的站点可靠性工程(SRE)是一个小而关键的团队,帮助我们的工程合作伙伴以卓越的方式“运营他们所拥有的”,以保护客户的体验。SRE通过定义操作应用程序的框架和最佳实践、构建工具、提供培训和咨询来实现这一目标。SRE的许多职责包括: • 向团队和领导层提供应用程序性能的数据和可见性 • 指导SLO的开发 • 推动事件管理和分析过程 • 引导变更管理和部署实践的实施 • 参与服务和架构的讨论 • 推荐可观察性和警报配置 SRE团队受益于多个领域的经验,包括: • 基础设施、平台和分布式系统 • 容量管理、负载和混沌测试 • 自动化、可观察性和配置管理 • 开发和产品经验 SRE团队正在寻找有经验的软件工程师,能够在Affirm的工程组织及更广泛的范围内构建和扩展可靠性和弹性实践。 工作内容 • 您将负责拥有和交付团队的季度目标,引导团队中的工程师通过不确定性解决开放性问题,并确保每个人在交付过程中得到支持。 • 您将通过与产品管理、设计和分析的合作,在产品开发生命周期中支持您的同事和利益相关者,参与创意构思,阐明技术约束,并在正确考虑风险和权衡的决策中合作。 • 您将主动识别项目、流程、技术或业务问题,为其倡导并领导解决。 • 您将通过创建和监控指标、在需要时升级问题以及支持“保持灯亮”和随叫随到的工作来支持团队工件的运营和可用性。 • 您将通过为团队设定或改进代码审查和设计标准,并通过写作和技术演讲在团队之外倡导这些标准,培养团队的质量和责任文化。 • 您将通过提供反馈和指导并以身作则来帮助团队发展人才。 我们寻找的特质 • 您有4年以上使用Python或Kotlin等语言设计、开发和启动大规模后端系统的经验。 • 您在使用AWS、MySQL和Kubernetes等技术开发高可用分布式系统方面有良好的记录。 • 您有4年以上在站点可靠性或生产工程团队工作的经验 • 您表现出好奇心和同理心,并持有强烈但灵活的观点 • 您有定义技术计划以优雅、简单和可扩展的设计交付重要功能或系统组件的经验。您编写的高质量代码易于他人理解和使用。 • 您擅长在大型代码库中进行重大更改,并开发了一套工具和实践,使您和您的团队能够安全地进行更改。 • 您的经验表明您对自己的成长负责,主动从团队、经理和利益相关者那里寻求反馈。 • 您拥有强大的口头和书面沟通能力,支持与我们全球工程团队的有效协作。 薪酬与福利 • 基本工资等级 - N • 股权等级 - 6 • 基本工资是总薪酬包的一部分,可能包括股权奖励、健康、健康和技术支出的每月津贴,以及福利(包括为您和您的家属提供100%补贴的医疗保险、牙科和视力保险)。 • 加拿大基本年薪范围:$150,000 - $200,000 Affirm以远程为主。我们的大多数职位是远程的,部分职位需要到办公室工作。由于工作职责的性质,少数职位仍然基于办公室。 福利 • 医疗保险 - Affirm为您和您的家属提供所有级别保险的全部保费 • 灵活支出钱包 - 用于技术、食品、各种生活方式需求和家庭形成费用的津贴 • 休假 - 允许您休息和充电的假期和假日安排 • 员工股票购买计划 - 让您以折扣价购买Affirm股票 我们致力于为所有人提供包容的面试体验,在招聘过程中提供合理的便利。 (对于可以在洛杉矶或旧金山进行的美国职位)Affirm将根据当地法律考虑有逮捕和定罪记录的合格申请人。 点击“提交申请”即表示您承认已阅读Affirm的全球候选人隐私声明,并同意按照其中描述收集、处理、使用和存储您的个人信息。 资历水平 • 中高级 就业类型 • 全职 工作职能 • 工程和信息技术 #J-18808-Ljbffr