职位描述
我们正在寻找一位经验丰富的高级 OpenShift 和 OpenStack 运维工程师,要求至少有 7 年的相关工作经验,以确保我们位于阿布扎比(阿联酋)的 OpenShift 和 OpenStack 平台的持续运行、高可用性和最佳性能。
主要职责
• 常驻工程与日常运营:
• 为 OpenShift 和 OpenStack 环境提供现场全面支持。
• 确保及时解决问题、故障排除和根本原因分析。
• 执行持续的系统监控、维护和性能调优。
• 在解决复杂的运营挑战时提供专家帮助。
• 高可用性与容错:
• 实施策略以最小化计划内和计划外的停机时间。
• 加强灾难恢复(DR)、故障转移机制和备份解决方案。
• 优化集群的健康性、可扩展性和弹性。
• 安全性与合规性:
• 加强容器安全、访问控制和合规性(例如,RBAC、网络策略)。
• 进行漏洞评估、补丁管理和强化。
• 确保遵循行业最佳实践和监管标准。
• 运营效率与自动化:
• 通过自动化(Ansible、Terraform、CI/CD 管道)减少人工干预,从而简化 IT 运营。
• 实施自愈机制、自动扩展和主动监控(Prometheus、Grafana、ELK)。
• 与 DevOps 团队合作,优化工作流程,减少运营开销。
• 知识转移与协作:
• 与 IT 团队、开发人员和利益相关者密切合作,以确保顺利运营。
• 进行培训和文档编写,以推广运营最佳实践。
• 为初级工程师提供指导,并促进持续改进的文化。