可靠性生产工程师(RPE)在RPE组织中扮演着提供生产支持服务的关键角色。该角色涉及开发自动化和工具,以支持站点可靠性工程(SRE)活动,重点是提高系统的可靠性和可支持性,例如减少手动工作、优化监控和提高警报效率。RPE与全球团队合作,维护和改进生产系统。
主要职责
• 为RPE组织范围内的系统提供生产支持
• 开发自动化和工具以提高可靠性并减少手动任务
• 监控数据库并在包括DB2、Greenplum、MongoDB和Snowflake在内的平台上执行性能调优
• 创建和维护用于数据分析和操作的数据库脚本(存储过程、复杂SQL)
• 开发和维护用于操作支持的Python和Linux Shell脚本
• 使用Docker和Kubernetes排除容器化环境的故障
• 使用可观测性工具分析系统指标和趋势
• 与全球团队有效合作,并在口头和书面形式上清晰沟通
• 支持轮班工作并参与随叫随到的轮值,以确保系统的持续可用性
• 遵守当前政策,每周至少三天在办公室工作
必需资格
• 计算机科学或相关领域的学士学位
• 4-5年数据库脚本、监控和性能调优经验(DB2、Greenplum、MongoDB、Snowflake)
• 熟练使用Linux操作系统
• 具有Python和Linux Shell脚本经验
• 拥有Docker和Kubernetes的实际经验,包括故障排除和可观测性堆栈工具
• 具备强大的口头和书面沟通能力,以便进行全球合作
• 能够灵活工作轮班并履行随叫随到的职责
优先资格
• 在金融服务或投资银行环境中的经验
• 熟悉高级监控和警报工具,如Splunk、AppDynamics或Elastic Search
• 了解包括GIT和Jenkins在内的开发工具
• 拥有敏捷、DevOps或SRE思维方式和相关工具经验
• 理解云技术及其在可靠性工程中的应用
认证(如有)
• 无需特定认证,但DevOps、云或SRE相关认证是一个加分项
电子邮件ID * 此字段为必填项 请填写有效的电子邮件ID。
手机 * 此字段为必填项 请填写有效的手机号码。
名字 * 此字段为必填项 请填写有效的名字。
姓氏 * 此字段为必填项 请填写有效的姓氏。