角色:DevOps工程师(具备SRE能力)
级别:E2(在所有列出的技术中具备中等能力)
关于该角色
我们正在寻找一名具备强大站点可靠性工程(SRE)能力的熟练DevOps工程师,以设计、构建和维护可扩展的基础设施,优化CI/CD流水线,并确保关键系统的可靠性。此角色需要具备实际操作的技术专长以及强大的问题解决、协作和沟通能力。
职责
设计、实施和管理CI/CD流水线。
在Azure DevOps、AWS(EC2、S3、Lambdas、RDS、IAM)和Kubernetes上开发和维护基础设施。
使用Python、PowerShell、Ansible自动化系统管理。
管理容器化环境(Docker)并优化集群操作。
使用AppDynamics、Grafana、Zabbix、Datadog或Dynatrace实施和监控应用性能。
配置和监控日志记录和可观察性工具(ELK、Splunk、Prometheus、CloudWatch)。
通过SonarQube、JFrog Artifactory确保软件交付的安全性。
与开发人员合作,审查代码,排除性能问题,并执行最佳实践。
主动识别瓶颈、可扩展性问题和可靠性风险。
记录系统、流程和事后分析学习。
所需技能
基础设施与云:Azure DevOps、AWS(E2+)、Kubernetes、Docker。
自动化与脚本:Python、PowerShell、Ansible、核心Java。
CI/CD与版本控制:端到端流水线设计与优化。
监控与可观察性:AppDynamics、Grafana、Zabbix、Datadog、Dynatrace、ELK、Splunk、Prometheus。
安全与质量工具:JFrog Artifactory、SonarQube。
专业能力
强大的根本原因分析和事件响应能力。
容量规划和系统可扩展性专业知识。
与技术和非技术利益相关者有效沟通。
自我激励、积极主动、足智多谋。
注重质量,工作标准高,返工最少。
持续学习者,分享知识并指导他人。
技能矩阵(候选人评估)
技能:
SRE, DevOps, AWS