职位概述:
我们正在寻找一位技术娴熟的SRE DevOps工程师加入一家领先的全球技术提供商,提供跨所有主要公共和私有云技术的专业知识和托管服务。理想的候选人应具备6年以上的经验,并且应能够实施SRE支持的标准和准则。作为SRE团队的成员,重点将放在实施SRE支持的标准和准则上。该角色涉及操作OpenStack私有云,并为云基础设施服务组合开发工具和集成。利用OpenStack知识,您将通过代码推动运营和发布的改进。此外,您还将使用常见的开源观测工具,如ELK和Grafana,进行主动警报以衡量和维护服务水平目标。与一线团队合作处理升级问题,这些情况将被用作自动化流程的机会。
主要职责:
• 使用DevOps模型为On-Prem(OpenStack)构建和改进应用程序和云平台的功能、可靠性、可用性和可管理性所需的软件
• 通过CI/CD流水线(Git、GitLab、Helm、Argo CD)自动化开发、测试和部署流程
• 与一线支持团队合作处理系统和客户升级问题
• 解决与基础设施、应用程序和网络相关的问题
• 与软件工程团队合作,优化应用程序的性能和可靠性
• 持续评估和改进系统和流程,提高可靠性、性能和效率
• 了解SRE和DevOps领域的行业趋势、最佳实践和新兴技术
所需资格:
• 扎实的OpenStack云基础设施背景和操作、修复和解决问题的经验
• 包括开发、测试、打包、部署、升级和支持在内的软件开发生命周期
• 具有OpenStack开发和运维经验。熟悉Keystone、Nova、Neutron、Glance等主要OpenStack组件
• Python的软件开发经验
• 能够为OpenStack编写补丁并为社区做出贡献
• 与开源社区合作进行错误修复/增强等
• 具备使用Ceph或其他基于云的存储支持软件定义存储的经验
• 包括KVM在内的虚拟化技术
• Redhat Enterprise Linux和/或CentOS的构建、开发和运维经验
• 在自动化流水线中构建和维护代码分发的经验
• 使用Ansible或Puppet进行配置管理的经验
• 软件定义网络技术,包括OVS、OVN、NFV等
• IaaC经验 - Terraform、Ansible、Git、GitLab、Jenkins、Helm、ArgoCD、Conjur/Vault