DevOps工程师/ SRE站点可靠性工程师

洛杉矶 25天前全职 网络
面议
角色:DevOps工程师(具备SRE能力) 级别:E2(在所有列出的技术中具备中等能力) 关于该角色 我们正在寻找一名具备强大站点可靠性工程(SRE)能力的熟练DevOps工程师,以设计、构建和维护可扩展的基础设施,优化CI/CD流水线,并确保关键系统的可靠性。此角色需要具备实际操作的技术专长以及强大的问题解决、协作和沟通能力。 职责 设计、实施和管理CI/CD流水线。 在Azure DevOps、AWS(EC2、S3、Lambdas、RDS、IAM)和Kubernetes上开发和维护基础设施。 使用Python、PowerShell、Ansible自动化系统管理。 管理容器化环境(Docker)并优化集群操作。 使用AppDynamics、Grafana、Zabbix、Datadog或Dynatrace实施和监控应用性能。 配置和监控日志记录和可观察性工具(ELK、Splunk、Prometheus、CloudWatch)。 通过SonarQube、JFrog Artifactory确保软件交付的安全性。 与开发人员合作,审查代码,排除性能问题,并执行最佳实践。 主动识别瓶颈、可扩展性问题和可靠性风险。 记录系统、流程和事后分析学习。 所需技能 基础设施与云:Azure DevOps、AWS(E2+)、Kubernetes、Docker。 自动化与脚本:Python、PowerShell、Ansible、核心Java。 CI/CD与版本控制:端到端流水线设计与优化。 监控与可观察性:AppDynamics、Grafana、Zabbix、Datadog、Dynatrace、ELK、Splunk、Prometheus。 安全与质量工具:JFrog Artifactory、SonarQube。 专业能力 强大的根本原因分析和事件响应能力。 容量规划和系统可扩展性专业知识。 与技术和非技术利益相关者有效沟通。 自我激励、积极主动、足智多谋。 注重质量,工作标准高,返工最少。 持续学习者,分享知识并指导他人。 技能矩阵(候选人评估) 技能: SRE, DevOps, AWS