职位编号:1047。具有深厚谷歌云平台专业知识的高级DevOps工程师。

多伦多 3天前全职 网络
面议
职位名称:高级 DevOps 工程师 - Google Cloud Platform (GCP) 工作地点:多伦多、密西沙加或蒙特利尔办公室 合同详情: 开始日期:2026年3月2日 结束日期:2026年9月4日 有可能延长:是 职位概述: 我们正在寻找一位具有深厚 Google Cloud Platform (GCP) 专业知识的高级 DevOps 工程师,负责设计、构建和运营安全、可扩展且具有弹性的云基础设施和 CI/CD 管道。 此角色在组织中发挥关键的支持和领导作用。招聘经理不具备深厚的 GCP 专业知识,特别希望找到一位能够作为技术权威的高级从业者,帮助塑造最佳实践,指导团队成员,并支持卓越中心模型。 该平台支持数据、人工智能和联络中心的计划,包括一个新推出的呼叫中心,利用 Vertex AI 和 GCP 联络中心 AI (CCAI) 组件。您将与工程、数据、架构和产品团队密切合作,以实现可靠的交付和跨共享平台的卓越运营。 主要职责: 云基础设施和平台工程 使用 Terraform 在多个环境中设计、构建、自动化和运营 GCP 基础设施 管理和保护 GCP 服务,包括: Compute Engine、GKE、Cloud Functions、Cloud Run Cloud Storage、VPC、Cloud Load Balancing、Cloud NAT、Cloud DNS IAM、Artifact Registry、Secret Manager、KMS 在 GKE 上架构和运营容器化工作负载,包括集群管理、网络、自动扩展、节点池和发布策略 CI/CD 和自动化 使用 GitHub Actions 设计、实施和优化应用程序和基础设施部署的 CI/CD 管道 推广 DevOps 最佳实践,如 GitOps、基于主干的开发、自动化测试、渐进式交付和基础设施测试 可观测性、可靠性和运营 使用 Cloud Monitoring、Cloud Logging、Trace 和 Error Reporting 实施和运营可观测性解决方案 构建仪表板、警报和 SLO/SLA 监控 参与值班轮换和事件响应 领导根本原因分析、可靠性改进、灾难恢复和备份策略 数据、AI 和事件驱动架构 使用 Pub/Sub、Cloud Functions 和 Cloud Run 启用事件驱动架构 支持数据和分析管道,包括 BigQuery;优化成本、性能和可靠性 支持 AI 和 ML 平台,包括 Vertex AI,并为卓越中心提供平台服务 支持和集成联络中心 AI (CCAI) 解决方案,如 Dialogflow CX、Agent Assist 和 CCAI Insights 安全、治理和支持 倡导安全优先的思维方式,包括 IAM 最小权限、服务账户、工作负载身份、组织政策、SCC 和漏洞扫描 与架构和产品团队合作制定安全、合规和治理标准 为平台标准、文档和运行手册做出贡献 指导和培训团队成员关于 GCP 最佳实践和平台使用 必备条件: 计算机科学、计算机工程学士学位或同等专业经验 5-8 年的整体经验,包括云环境中的 DevOps 3 年以上 Google Cloud Platform (GCP) 实际操作经验 具有 GCP 基础设施和平台运营的丰富实践经验 精通 Terraform、GitHub 和 GitHub Actions 熟练使用 Python 进行自动化、工具和管道开发 具有 Bash 脚本编写经验 强大的网络知识,包括:VPC 设计、子网、对等连接、私有服务连接 L7/L4 负载均衡器、防火墙、Cloud NAT 具有 Kubernetes (GKE) 和 Docker 的丰富经验 加分项/资产: 具有 Vertex AI 和 ML 平台支持经验 具有联络中心技术或 GCP CCAI 经验 熟悉 BigQuery、Dataflow 和分析平台 可观测性工具,如 OpenTelemetry、Prometheus、Grafana 具有 AWS、Snowflake 或 Databricks 经验 具有 Istio/服务网格经验 具有 OpenShift 经验 具有 Node.js 或 Java 经验 专业能力: 沟通和协作能力强,能够跨工程、数据和架构团队工作 能够作为技术权威和导师 以客户和平台为导向的思维方式,专注于长期价值和可靠性 在快节奏环境中高度适应性强、积极主动且有效 强大的问题解决和故障排除能力 高度重视质量、安全性和运营卓越 免责声明: 可能会使用 AI 评估候选人。 此职位发布是为了填补现有空缺。请申请。