可靠性生产工程师

蒙特利尔 28天前全职 网络
面议
可靠性生产工程师(RPE)在RPE组织中扮演着提供生产支持服务的关键角色。该角色涉及开发自动化和工具,以支持站点可靠性工程(SRE)活动,重点是提高系统的可靠性和可支持性,例如减少手动工作、优化监控和提高警报效率。RPE与全球团队合作,维护和改进生产系统。 主要职责 • 为RPE组织范围内的系统提供生产支持 • 开发自动化和工具以提高可靠性并减少手动任务 • 监控数据库并在包括DB2、Greenplum、MongoDB和Snowflake在内的平台上执行性能调优 • 创建和维护用于数据分析和操作的数据库脚本(存储过程、复杂SQL) • 开发和维护用于操作支持的Python和Linux Shell脚本 • 使用Docker和Kubernetes排除容器化环境的故障 • 使用可观测性工具分析系统指标和趋势 • 与全球团队有效合作,并在口头和书面形式上清晰沟通 • 支持轮班工作并参与随叫随到的轮值,以确保系统的持续可用性 • 遵守当前政策,每周至少三天在办公室工作 必需资格 • 计算机科学或相关领域的学士学位 • 4-5年数据库脚本、监控和性能调优经验(DB2、Greenplum、MongoDB、Snowflake) • 熟练使用Linux操作系统 • 具有Python和Linux Shell脚本经验 • 拥有Docker和Kubernetes的实际经验,包括故障排除和可观测性堆栈工具 • 具备强大的口头和书面沟通能力,以便进行全球合作 • 能够灵活工作轮班并履行随叫随到的职责 优先资格 • 在金融服务或投资银行环境中的经验 • 熟悉高级监控和警报工具,如Splunk、AppDynamics或Elastic Search • 了解包括GIT和Jenkins在内的开发工具 • 拥有敏捷、DevOps或SRE思维方式和相关工具经验 • 理解云技术及其在可靠性工程中的应用 认证(如有) • 无需特定认证,但DevOps、云或SRE相关认证是一个加分项 电子邮件ID * 此字段为必填项 请填写有效的电子邮件ID。 手机 * 此字段为必填项 请填写有效的手机号码。 名字 * 此字段为必填项 请填写有效的名字。 姓氏 * 此字段为必填项 请填写有效的姓氏。