DevOps工程师 - DevOps/Datadog专家(主题专家)

温哥华 30天前全职 网络
206 - 231 / 时
该职位已过期,不再接受申请。
#### 重要 ##### 请仅在您位于大温哥华地区或卡尔加里时申请。 其他申请者将不被考虑。 概述 在 Squadric,我们与组织合作,构建现代化、可扩展和智能的技术解决方案。我们正在寻找一名 Datadog 专家来担任合同职位。此角色将作为 Datadog 的主题专家(SME),领导我们如何监控、警报和观察我们复杂的基础设施和应用程序。您将与工程师、SRE 和领导层紧密合作,设计可观测性策略,推进最佳实践,并推动可衡量的性能洞察。 这是一个混合角色,每周需要两天在办公室合作,地点在 BC 的萨里或 AB 的卡尔加里,其余工作可远程进行。 角色概述 虽然根植于 DevOps,但此职位更侧重于使用 Datadog 的监控、警报、仪表板和可观测性策略,而不仅仅是一般的 Ops 职责。您的经验将指导我们的客户如何采用和扩展监控实践,以实现可靠性、性能和以客户为中心的成果。 您将做什么 • 作为团队内 Datadog 的首选专家。 • 设计、实施、配置和优化 Datadog 环境,包括指标收集、仪表板、监控/警报和日志记录。 • 在 Datadog 中建立标记实践、警报阈值、SLIs/SLOs 和可视化标准。 • 在基础设施、应用程序、微服务、容器和云平台上领导可观测性策略。 • 提出改进和运营最佳实践,以提高可靠性并减少警报疲劳。 • 构建、维护和微调 Datadog 监控和警报,以确保对事件的主动响应。 • 与工程团队合作,将业务和运营优先事项转化为可观测性要求。 • 使用日志、指标、跟踪、事件和自定义仪表板排除问题。 • 在适用的情况下,支持 CI/CD 管道、自动化和基础设施即代码(IaC)。 • 指导和教育 DevOps/SRE/工程团队关于可观测性最佳实践。 • 参与事件响应和事后分析,以持续改进监控结果。 您需要具备的条件 • 计算机科学、软件工程、计算机工程或相关领域的学士学位或更高。 • 3 年以上 DevOps、SRE、站点可靠性、监控、可观测性或相关角色的经验,并有可衡量的影响。 • 必须具备使用 Datadog 设计监控、警报、仪表板和可观测性实施的实际经验。 • 在生产环境中应用 Datadog 最佳实践的成功记录。 • Datadog 认证。至少需要 Datadog 基础认证。 • 具有基础设施工具经验:云平台(Azure)、IaC(Terraform)、CI/CD 自动化、容器化(Kubernetes)。 为什么加入 Squadric? • 与北美顶尖公司合作,参与具有挑战性的项目。 • 在混合模式下工作,结合灵活性与面对面合作。 • 加入一个支持性和创新的环境,致力于质量和持续改进。 公司描述 为什么加入 Squadric? 与北美顶尖公司合作,参与具有挑战性的数据工程项目。 在混合模式下工作,结合灵活性与面对面合作。 加入一个支持性和创新的环境,致力于质量和持续改进。