职位名称:高级 DevOps 工程师 - Google Cloud Platform (GCP)
工作地点:多伦多、密西沙加或蒙特利尔办公室
合同详情:
开始日期:2026年3月2日
结束日期:2026年9月4日
有可能延长:是
职位概述:
我们正在寻找一位具有深厚 Google Cloud Platform (GCP) 专业知识的高级 DevOps 工程师,负责设计、构建和运营安全、可扩展且具有弹性的云基础设施和 CI/CD 管道。
此角色在组织中发挥关键的支持和领导作用。招聘经理不具备深厚的 GCP 专业知识,特别希望找到一位能够作为技术权威的高级从业者,帮助塑造最佳实践,指导团队成员,并支持卓越中心模型。
该平台支持数据、人工智能和联络中心的计划,包括一个新推出的呼叫中心,利用 Vertex AI 和 GCP 联络中心 AI (CCAI) 组件。您将与工程、数据、架构和产品团队密切合作,以实现可靠的交付和跨共享平台的卓越运营。
主要职责:
云基础设施和平台工程
使用 Terraform 在多个环境中设计、构建、自动化和运营 GCP 基础设施
管理和保护 GCP 服务,包括:
Compute Engine、GKE、Cloud Functions、Cloud Run
Cloud Storage、VPC、Cloud Load Balancing、Cloud NAT、Cloud DNS
IAM、Artifact Registry、Secret Manager、KMS
在 GKE 上架构和运营容器化工作负载,包括集群管理、网络、自动扩展、节点池和发布策略
CI/CD 和自动化
使用 GitHub Actions 设计、实施和优化应用程序和基础设施部署的 CI/CD 管道
推广 DevOps 最佳实践,如 GitOps、基于主干的开发、自动化测试、渐进式交付和基础设施测试
可观测性、可靠性和运营
使用 Cloud Monitoring、Cloud Logging、Trace 和 Error Reporting 实施和运营可观测性解决方案
构建仪表板、警报和 SLO/SLA 监控
参与值班轮换和事件响应
领导根本原因分析、可靠性改进、灾难恢复和备份策略
数据、AI 和事件驱动架构
使用 Pub/Sub、Cloud Functions 和 Cloud Run 启用事件驱动架构
支持数据和分析管道,包括 BigQuery;优化成本、性能和可靠性
支持 AI 和 ML 平台,包括 Vertex AI,并为卓越中心提供平台服务
支持和集成联络中心 AI (CCAI) 解决方案,如 Dialogflow CX、Agent Assist 和 CCAI Insights
安全、治理和支持
倡导安全优先的思维方式,包括 IAM 最小权限、服务账户、工作负载身份、组织政策、SCC 和漏洞扫描
与架构和产品团队合作制定安全、合规和治理标准
为平台标准、文档和运行手册做出贡献
指导和培训团队成员关于 GCP 最佳实践和平台使用
必备条件:
计算机科学、计算机工程学士学位或同等专业经验
5-8 年的整体经验,包括云环境中的 DevOps
3 年以上 Google Cloud Platform (GCP) 实际操作经验
具有 GCP 基础设施和平台运营的丰富实践经验
精通 Terraform、GitHub 和 GitHub Actions
熟练使用 Python 进行自动化、工具和管道开发
具有 Bash 脚本编写经验
强大的网络知识,包括:VPC 设计、子网、对等连接、私有服务连接
L7/L4 负载均衡器、防火墙、Cloud NAT
具有 Kubernetes (GKE) 和 Docker 的丰富经验
加分项/资产:
具有 Vertex AI 和 ML 平台支持经验
具有联络中心技术或 GCP CCAI 经验
熟悉 BigQuery、Dataflow 和分析平台
可观测性工具,如 OpenTelemetry、Prometheus、Grafana
具有 AWS、Snowflake 或 Databricks 经验
具有 Istio/服务网格经验
具有 OpenShift 经验
具有 Node.js 或 Java 经验
专业能力:
沟通和协作能力强,能够跨工程、数据和架构团队工作
能够作为技术权威和导师
以客户和平台为导向的思维方式,专注于长期价值和可靠性
在快节奏环境中高度适应性强、积极主动且有效
强大的问题解决和故障排除能力
高度重视质量、安全性和运营卓越
免责声明:
可能会使用 AI 评估候选人。
此职位发布是为了填补现有空缺。请申请。