高级 DevOps 工程师;GCP

阿布扎比 无个税4个月前全职 网络
23.5万 - 39.2万 / 年
职位:高级 DevOps 工程师(GCP) 1994 年,俄罗斯黑客弗拉基米尔·列昂尼多维奇·列宾通过拨号上网尝试进行世界上最大规模的银行抢劫,创始人及首席执行官 Zia Hayat 深受吸引——椅子上的诈骗变成了现实的可能性。从那一刻起,Zia 知道他想参与阻止坏人并为所有人保护互联网。成立于 2012 年,Callsign 的使命是让数字身份对每个人和每件事都变得简单和安全。 在这段时间里,我们的员工人数已超过 200 人,在新加坡和阿布扎比开设了办事处,被认定为世界经济论坛全球创新者,我们的技术被许多世界领先的金融机构使用,以保护数百万消费者的安全。 但我们并未止步于此。Callsign 正在推进多云战略,并寻找在 Google Cloud Platform 方面具有经验的杰出人才。作为 Callsign 的 GCP 高级 DevOps 工程师,您将与我们的工程团队密切合作,设计、架构、开发、实施、优化和维护 Google Cloud Platform 上的云原生解决方案,以发挥关键作用。要成功,您应能够识别最优的基于云的解决方案,并根据最佳实践和安全政策维护云基础设施。 职责: 在 Google Cloud Platform(GCP)上架构、实施和管理可扩展且安全的基础设施,利用核心服务,如 GKE、Cloud Run、Managed Apache Kafka、Cloud SQL 和 Memory Store,以支持高可用性和性能关键的应用程序。 使用基础设施即代码(IaC)工具(如 Terraform)设计和自动化基础设施供应,确保可重复性和一致性。 使用 Git Lab CI 和 Git Ops 工具(如 FluxCD 或 ArgoCD)开发和维护 CI/CD 管道,实现无缝的应用程序交付。 在集群管理、网络和工作负载编排方面具有专业知识,操作和优化 Kubernetes 集群。 具有自定义 Kubernetes 操作符经验者优先。 使用 Prometheus、Grafana、New Relic、Elastic Search、Google Cloud Logging 和 Monitoring 等工具实施和增强可观察性,以确保系统健康和性能。 领导灾难恢复(DR)规划和操作,包括跨区域和多云(GCP/AWS)故障转移、自动化工作流和 RTO/RPO 验证。 持续改进系统性能、可扩展性和安全性,保持对 GCP 最新产品和最佳实践的了解。 在 GCP 上设计和实施云原生解决方案,利用行业标准模式和 Google 的云架构框架。通过根本原因分析和团队协作解决技术障碍。 指导初级工程师并为 DevOps 实践的发展做出贡献。 计算机科学、工程或相关领域的学士学位。 8-10 年 DevOps 或云基础设施经验,至少 5 年在 GCP 生产环境中的经验。 在 GCP 原生服务方面的证明经验,尤其是 GKE、Cloud SQL、Memory Store 和 Kafka。 具备 MySQL/PostgreSQL、Redis、Kafka 等状态系统的实际操作经验,专注于部署、扩展和数据持久性。 精通 Terraform。 具有 Git Lab CI 和 Git Ops 工作流的 CI/CD 工具经验。 精通 Golang 和 Python 的高级脚本技能。 对 Kubernetes 内部机制有深入理解。 具有包括 Prometheus、Grafana 和 Google 的操作套件在内的可观察性堆栈的经验。 在灾难恢复操作方面的经验,尤其是涉及 AWS 的多云策略。拥有 Google Cloud Professional Cloud Architect 认证或同等资格者优先。 优秀的故障排除和沟通能力。 附加条件: 具备 GCP 数据分析和 AI/ML 服务(如 Big Query、Dataproc、Dataplex 和 Vertex AI)的经验。 熟悉 GCP 安全工具,包括 IAM、工作负载身份、漏洞扫描和机密管理。 具有构建内部工具和可重用基础设施组件的经验。 提供前往阿布扎比的搬迁支持,包括机票、住宿和您及家属的签证支持。 年度机票津贴,用于往返家乡的航班。 为您和家属提供全面的医疗保险。 3 个月全薪产假和 2 周陪产假。 25 天年假 + Callsign 假期(不计入假期津贴)。