概述
我们正在寻找一位经验丰富的 DevOps 与发布管理工程师,负责管理补丁、基础设施升级、OpenShift 平台以及企业级发布流程。理想的候选人应具备 Linux、容器平台、自动化、CI/CD 和跨职能协作的强大专业知识,以确保安全、稳定和高效的应用交付。
主要职责
补丁与基础设施管理
• 实施和管理全面的操作系统、应用程序和网络设备的补丁管理策略,以确保安全性和合规性。
• 规划、执行和监督硬件、软件和网络组件的基础设施升级,同时最小化停机时间并确保兼容性。
• 开发和优化补丁前后流程,以确保零干扰执行和基于风险的补丁优先级。
• 支持 Linux 环境的扩展、调优、自动化、补丁和合规审计。
• 管理和维护操作系统、网络基础设施和安全补丁。
OpenShift (OCP) 管理
• 部署、管理和维护 OpenShift 容器平台 (OCP) 集群,包括安装、配置、扩展和故障排除。
• 执行 OpenShift 集群维护,如升级、补丁、监控和性能优化。
• 监控集群健康,确保高可用性、可靠性和遵循企业标准。
网络与系统操作
• 监控和管理网络性能、容量和安全性。
• 排查网络、硬件和软件相关问题,以确保业务连续性。
• 确保所有网络变更和升级遵循安全政策、最佳实践和组织标准。
发布管理
• 领导软件发布的规划、协调和执行,跨环境和团队进行。
• 制定和管理与业务目标一致的发布计划、时间表和预算。
• 设计和实施自动化构建、测试和部署管道,以加速软件交付。
• 管理和维护版本控制系统 (例如 Git),确保正确的分支、合并和标记策略。
• 与开发、QA 和运营协调发布活动,确保顺利及时的部署。
• 排查构建和部署失败,识别根本原因并实施预防措施。
• 维护清晰和更新的发布流程、管道和工具文档。
• 实施和执行 CI/CD 最佳实践,以确保一致性和可靠性。
• 在发布后监控生产环境,以确保稳定性并在需要时处理即时问题。
• 管理影响发布范围、时间表和质量的风险,必要时升级问题。
• 确保遵循技术标准和治理要求,包括在适用时支持原型车构建。
• 在分布式、负载均衡和面向服务的架构中领导复杂的部署。
所需技能与经验
• 拥有 OpenShift 或 Kubernetes 管理的丰富经验
• 具备补丁管理和基础设施更新的实践经验
• 对 Linux 系统、网络和安全概念有良好的理解
• 精通 CI/CD 管道、自动化和 DevOps 工具
• 熟练使用 Git 和版本控制管理
• 优秀的故障排除和问题解决能力
• 能够在跨职能团队中工作并管理端到端的发布周期