站点可靠性工程师 | 远程 | Python | 大型客户

16个月前远程全职
Square One Resources

Square One Resources

location 伦敦
unsaved
职位名称:现场可靠性工程师 - 实时编码 地点:完全远程 薪资/费率:最高£710内IR35/天 开始日期:2024年1月2日 职位类型:6个月初步合同(2-3年计划) 现场可靠性工程师(SRE)结合了工程经验和改进现有系统和流程的内在动力,以及开发创新解决方案以应对不断变化的挑战的创造力。对于组织来说,SRE通常负责关键平台服务和应用程序的可用性和可靠性,确保它们满足内部和外部用户的要求。 主要 - 必备技能: 1. 在Go、Java、C++、Python等一种或多种编程语言中具有微服务经验(了解微服务:Restful服务 - RPC服务)。 2. 具备分布式系统的经验(例如RestAPI、Protobuff)。 3. 良好的问题解决和分析思维能力,以及出色的注重细节能力。 4. 良好的沟通和协作能力。 5. 能够使用Python进行编程。 6. Linux管理员(系统管理和网络配置)。 7. 故障排除和故障排查(应用程序和基础设施)生产性能问题。 8. 了解MQ(消息队列 - 例如Kafka、RabbitMQ)。 9. Kubernetes管理。 10. CICD工具和DevOps自动化。 次要 - 附加技能,按优先顺序列出: 1. Shell脚本编写。 2. 容器知识。 3. 了解分布式系统,例如consul、zookeeper、mongodb等。 4. 了解Saltstack。 5. 监控工具使用:Grafana、Prometheus等。 6. 精通设计、分析和故障排除大规模分布式系统。 7. 能够调试、优化代码和自动化常规任务。 8. 精通算法、数据结构和生产故障排除。 9. 在解决问题和分析全球规模的分布式系统方面具有专业知识。 10. 有系统的解决问题的方法,结合有效的沟通技巧和驱动力。 如果您对此机会感兴趣,请立即使用Microsoft Word/PDF格式的更新简历申请。 免责声明 尽管给出了所需经验水平的任何指导方针,但如果候选人能够证明必要的能力,我们将考虑超出此范围的候选人。 Square One同时是一家招聘机构和就业机构,并且是一家平等机会招聘企业。Square One积极拥抱多样性,将平等对待每个人。请参阅我们的网站以获取完整的多样性声明。 如果您对此机会感兴趣,请立即使用Microsoft Word/PDF格式的更新简历申请。