职位名称: DevOps / SRE
工作地点: 康涅狄格州斯坦福(现场)
职位描述
• 性能工程
• 使用 Apache JMeter 或同类工具设计和开发性能测试脚本。
• 创建测试场景,包括负载、压力、峰值、耐久性和可扩展性。
• 与开发人员、架构师和业务利益相关者合作,了解性能目标。
• 具备 Dynatrace、Grafana 或 Kibana 的经验。
DevOps / SRE / 平台工程
• 10年以上 DevOps、SRE 或平台工程经验。
• 6年以上 Kubernetes 经验。
• 3年以上大规模 OpenShift 4.x 操作经验。
• 拥有企业级 OpenShift 4.x 平台的管理,涵盖本地和云环境。
• 提供可靠、安全、自动化的集群;通过 GitOps 和黄金模式实现开发者自助服务。
• 领导升级、扩展和多集群操作。
核心技能
• 扎实的 Linux(RHEL)、网络(TCP/IP、DNS、TLS、路由)、存储概念。
• Terraform/Ansible(基础设施即代码)。
• Argo CD、Tekton、Operators、Helm/Kustomize。
• 具备 ODF/OCS 和集群升级的经验。
• 安全性:RBAC、SCC/PSA、网络策略、供应链控制、漏洞修复。
• 在所有平台层面上出色的故障排除能力。
OpenShift 专业知识
• 设计和实施 OpenShift 集群(IPI/UPI)。
• 第二天操作:机器配置、升级、节点池。
• 使用 ACM/OCM 进行多集群管理。
• 网络/入口:OVN-Kubernetes、Multus、入口控制器/路由、L4/L7 负载均衡、DNS/TLS。
• 存储:ODF/OCS/Ceph/Portworx、PVC/PV 类别、性能调优、备份/恢复(Velero/OADP)。
GitOps / CI-CD / 安全性
• GitOps 优先启用:Argo CD(应用程序中的应用程序)、Helm/Kustomize、Operators。
• 为命名空间、配额、RBAC、策略构建可重用模板。
• Tekton/OpenShift 管道、Quay/Harbor、镜像签名/推广、SBOM、漏洞扫描(RHACS/StackRox/Trivy)。
• SCC/PSA、网络策略、机密管理、合规操作员/OpenSCAP、Gatekeeper/Kyverno。
• 安全态势:CVE 修复、审计合规、政策一致性。
附加技能
• 红帽认证(EX280/EX288、RHCSA、RHCE)。
• 服务网格(Istio/红帽服务网格)。
• Keycloak/SSO。
• 外部机密 / Vault。
• AWS/Azure/GCP 集成(负载均衡、DNS、IAM、机密)、成本管理/显示。