可观测性工程师(云和 Kubernetes)
地点:蒙特利尔,QC
混合角色:每周3天现场办公,2天远程办公。
雇佣类型:1年合同(FTC)
关于该职位
我们正在寻找一位高级可观测性工程师,帮助设计、构建和扩展现代可观测性平台,覆盖私有和公共云环境。
此职位非常适合对云原生和混合应用程序的监控、可靠性和性能工程充满热情的人。
您将与 DevOps、SRE、平台和安全团队密切合作,提供可扩展的遥测解决方案,以提高系统可见性、正常运行时间和性能。
🛠️ 主要职责
• 为云和 Kubernetes 环境设计和实施监控、日志记录和追踪解决方案
• 构建仪表板、警报和自动化可观测性工作流
• 将可观测性集成到 CI/CD 管道中
• 支持多云环境(AWS/Azure/GCP)中可观测性平台的现代化
• 使团队能够使用遥测数据进行可靠性和性能改进
• 分享最佳实践并推动可观测性标准的采用
• 指导团队并支持知识转移
• 在需要时参与值班轮换
所需技能
• 5年以上可观测性、监控或 SRE 角色经验
• 至少具备一个云平台(AWS、Azure 或 GCP)的经验
• 熟练使用以下工具:
• Grafana、Prometheus、Datadog、Splunk、Elastic、Loki、Tempo 或类似工具
• Kubernetes 和容器监控经验(EKS/AKS/GKE)
• 仪表板创建、警报和遥测配置
• CI/CD 集成和自动化(Terraform、YAML、Python 或 Bash)
• Linux 系统知识
• 理解应用程序和基础设施架构
• 良好的沟通和问题解决能力
加分项
• 分布式追踪和应用程序检测经验
• APM 工具经验
• Go 编程知识
• DevOps 自动化背景
• HA/DR 架构知识
• 网络基础知识(TCP/IP、HTTP、负载均衡器)