职责:
1. 与软件工程师合作,自动化和加速应用程序的测试、发布和部署,快速而可靠地进入运行时环境。
2. 建立、维护和改进持续交付系统的CI/CD流水线。
3. 维护、优化和改进云基础设施,以确保以合理的成本实现零计划停机时间。
4. 停机时间发生管理和根本原因分析。
5. 监控生命周期过程的遵守情况,并更新/创建新的流程以改进和减少浪费。
6. 与客户支持团队紧密合作,确保关键任务软件应用程序的零计划停机时间。
7. 创建DevOps文档,并更新现有文档,包括概念、设计文档、测试用例、API和流程。
8. 积极参与春季计划、每日站立会和回顾会议。
9. 与内部团队合作和协调,实现整体目标和策略。
要求:
1. 计算机科学、电子工程或其他相关工程学位。
2. 6-8年的DevOps经验。
3. 对以下内容有良好的理解和经验:
• 云技术:AWS
• 基础设施即代码:Terraform/Cloudformation
• 构建管理:Jenkins,Github Actions
• 配置管理工具:Ansible
• 监控和日志管理:Prometheus,Grafana,ELK
• 容器:Docker,Docker-compose,Kubernetes
• Web托管技术:Nginx,Apache Web服务器
• 源代码控制工具:Git
4. 具有以下实际经验:
• Linux shell脚本编写、网络和通过SSH配置Linux服务器
• 设置高可用性应用程序,如Apache Kafka和Apache Airflow进行数据集成
• 设置高可用性数据库,如Postgres,MongoDB
5. 熟练掌握JavaScript
6. 对软件开发生命周期有良好的理解
7. 良好的团队合作精神
8. 良好的沟通能力