职位概述
我们正在寻找一位熟练的 DevOps 工程师加入我们的团队。在这个角色中,您将负责部署和操作我们的系统,自动化和简化操作和流程,构建和维护部署、监控和运营工具。
主要职责:
• 管理部署在公共或私有云(隔离环境)上的解决方案基础设施。
• 部署应用程序更新。
• 通过跟踪技术和业务指标、设置警报以及主动防止问题,监控环境健康状况。
• 评估和进行新技术的概念验证。
• 为知识库做出贡献。
• 分析服务性能,识别瓶颈,并制定改进计划。
• 确保遵守 QHSE、业务连续性、信息安全、隐私、风险和治理政策。
要求:
• 3 年以上管理 Kubernetes 集群的经验。
• 3 年以上配置/调优可观察性平台(例如,Prometheus)的经验。
• 扎实的 Linux 管理背景。
• 对网络概念有良好的理解。
加分技能:
• 消息队列知识(优先考虑 RabbitMQ)。
• 有 Elasticsearch(ELK 堆栈)经验。
• 有向量数据库经验。
• 有部署 GPU 工作负载的经验。
我们提供:
在快速变化和动态环境中的职业机会,接触尖端技术。
具有竞争力的薪酬和福利套餐。
专业发展和成长机会。
多样化和包容性的工作环境。