#### 重要 #####
请仅在您位于大温哥华地区或卡尔加里时申请。
其他申请者将不被考虑。
概述
在 Squadric,我们与组织合作,构建现代化、可扩展和智能的技术解决方案。我们正在寻找一名 Datadog 专家来担任合同职位。此角色将作为 Datadog 的主题专家(SME),领导我们如何监控、警报和观察我们复杂的基础设施和应用程序。您将与工程师、SRE 和领导层紧密合作,设计可观测性策略,推进最佳实践,并推动可衡量的性能洞察。
这是一个混合角色,每周需要两天在办公室合作,地点在 BC 的萨里或 AB 的卡尔加里,其余工作可远程进行。
角色概述
虽然根植于 DevOps,但此职位更侧重于使用 Datadog 的监控、警报、仪表板和可观测性策略,而不仅仅是一般的 Ops 职责。您的经验将指导我们的客户如何采用和扩展监控实践,以实现可靠性、性能和以客户为中心的成果。
您将做什么
• 作为团队内 Datadog 的首选专家。
• 设计、实施、配置和优化 Datadog 环境,包括指标收集、仪表板、监控/警报和日志记录。
• 在 Datadog 中建立标记实践、警报阈值、SLIs/SLOs 和可视化标准。
• 在基础设施、应用程序、微服务、容器和云平台上领导可观测性策略。
• 提出改进和运营最佳实践,以提高可靠性并减少警报疲劳。
• 构建、维护和微调 Datadog 监控和警报,以确保对事件的主动响应。
• 与工程团队合作,将业务和运营优先事项转化为可观测性要求。
• 使用日志、指标、跟踪、事件和自定义仪表板排除问题。
• 在适用的情况下,支持 CI/CD 管道、自动化和基础设施即代码(IaC)。
• 指导和教育 DevOps/SRE/工程团队关于可观测性最佳实践。
• 参与事件响应和事后分析,以持续改进监控结果。
您需要具备的条件
• 计算机科学、软件工程、计算机工程或相关领域的学士学位或更高。
• 3 年以上 DevOps、SRE、站点可靠性、监控、可观测性或相关角色的经验,并有可衡量的影响。
• 必须具备使用 Datadog 设计监控、警报、仪表板和可观测性实施的实际经验。
• 在生产环境中应用 Datadog 最佳实践的成功记录。
• Datadog 认证。至少需要 Datadog 基础认证。
• 具有基础设施工具经验:云平台(Azure)、IaC(Terraform)、CI/CD 自动化、容器化(Kubernetes)。
为什么加入 Squadric?
• 与北美顶尖公司合作,参与具有挑战性的项目。
• 在混合模式下工作,结合灵活性与面对面合作。
• 加入一个支持性和创新的环境,致力于质量和持续改进。
公司描述
为什么加入 Squadric?
与北美顶尖公司合作,参与具有挑战性的数据工程项目。
在混合模式下工作,结合灵活性与面对面合作。
加入一个支持性和创新的环境,致力于质量和持续改进。