责任领域
我们正在寻找一位经验丰富且技术精湛的高级生产支持工程师,加入我们位于美国的动态技术团队。理想的候选人应具备7-10年支持高流量、关键应用的实际经验,深入掌握我们的核心技术栈,并对金融服务领域有扎实的理解。
主要职责
事件管理与解决:作为高优先级生产事件的主要联系人。推动及时解决,进行根本原因分析(RCA),并实施预防措施以减少未来事件的发生。
应用监控与健康:使用Splunk和New Relic等高级监控工具主动监控生产应用的健康、性能和容量。开发和维护仪表板、警报和运行手册。
变更管理:评估、批准并监督生产变更,严格遵循变更管理协议以确保稳定性并将风险降至最低。参与发布和部署活动。
性能优化:识别应用代码和基础设施(Java、数据库、缓存)中的性能瓶颈,并与开发团队合作实施修复和效率改进。
系统维护:对运行在AWS和Pivotal Cloud Foundry(PCF)上的应用基础设施进行定期系统维护、健康检查和容量规划。
文档与知识共享:创建和维护全面的支持文档、知识库文章和故障排除指南。
值班支持:参与值班轮换,为关键生产系统提供24/7支持。
所需技术技能与经验(7-10年)
核心编程:Java(深厚的熟练度)7年以上
框架:Spring Boot(微服务架构-广泛)
前端:React(应用流程的理解):熟练
云/PaaS:AWS, Pivotal Cloud Foundry(PCF):强
数据库:MySQL(查询、优化、故障排除):强
缓存/消息:Redis,缓存管理原则:专家
监控/日志:Splunk, New Relic:专家(开发查询、仪表板、警报)
流程:事件管理、变更管理:强(ITIL框架知识是加分项)
🏦 领域知识
对银行和金融服务行业有中等到强的理解。
在一个或多个领域的具体知识是非常理想的:
信用卡(发行、交易、对账)
支付(网关、处理、结算)
贷款(发放、服务、支付处理)
候选人简介
能够快速分析复杂的技术问题,提供有效的解决方案,并在压力下推动永久解决。
优秀的沟通能力,能够向技术和非技术利益相关者总结技术问题和更新。
具有强烈的责任感和紧迫感的自我启动者。
计算机科学、工程或相关领域的学士学位(或同等的实际经验)。