岗位职责:
1. 监控系统,进行检查,响应故障,调查问题,并推动优化措施。
2. 领导系统维护流程的标准化和自动化,为平台开发做出贡献,提高整体质量和效率。
3. 不断提供关于系统架构、性能和稳定性改进的建议。
4. 分析和总结事故和故障,提出技术解决方案,并与团队合作实施。
5. 发现系统运营的优化机会,并推动改进。
首选资格:
1. 计算机科学、数学或相关领域的学士学位,或相当于8年工作经验。
2. 熟练掌握Linux,并精通至少一种Go、Shell或Python编程语言。能够利用Ansible或Saltstack进行配置管理。
3. 对互联网技术栈有深入的了解,包括通信协议、负载均衡和微服务架构。
4. 在容器技术方面有实际经验,尤其是在Docker和Kubernetes方面至少有3年的经验。
5. 熟悉AWS、阿里云或华为云等云平台,有实际经验者优先。
6. 熟悉Kafka、ZooKeeper、Redis和Elasticsearch,包括它们的最佳实践和理想用例。
7. 具备逻辑思维能力,沟通能力强,能够深入业务并定位问题,具有清晰的故障排除思维。
8. 对基础设施即代码(IaC)、大规模监控、运营数据分析和治理、容器技术和运营平台开发有深入的了解将是一个重要的优势。
9. 熟悉维护高并发Java金融科技项目。
10. 热情自主,对最新技术保持强烈的热情。