DevOps工程师 – Datadog专家

温哥华 30天前合同 网络
面议
该职位已过期,不再接受申请。
概述 在Squadric,我们与组织合作,构建现代化、可扩展和智能的技术解决方案。我们正在寻找一名Datadog专家来担任合同职位。 该角色将作为Datadog方面的主题专家(SME),引领我们如何监控、警报和观察复杂的基础设施和应用程序。 您将与工程师、SRE和领导层紧密合作,设计可观测性策略,推进最佳实践,并推动可衡量的性能洞察。 这是一个混合角色,每周需要在办公室协作两天,地点在不列颠哥伦比亚省的萨里或阿尔伯塔省的卡尔加里,其余工作可远程进行。 角色概述 虽然根植于DevOps,但该职位更侧重于使用Datadog进行监控、警报、仪表板和可观测性策略,而不仅仅是一般的Ops职责。 您的经验将指导我们的客户如何采用和扩展监控实践,以实现可靠性、性能和以客户为中心的结果。 您的工作内容 作为团队内部Datadog的首选专家。 设计、实施、配置和优化Datadog环境,包括指标收集、仪表板、监控/警报和日志记录。 在Datadog中建立标记实践、警报阈值、SLI/SLO和可视化标准。 在基础设施、应用程序、微服务、容器和云平台上引领可观测性策略。 提出改进和操作最佳实践,以提高可靠性并减少警报疲劳。 构建、维护和微调Datadog监控和警报,以确保对事件的主动响应。 与工程团队合作,将业务和操作优先事项转化为可观测性需求。 使用日志、指标、跟踪、事件和自定义仪表板进行故障排除。 支持CI/CD管道、自动化和基础设施即代码(IaC),如适用。 指导和教育DevOps/SRE/工程团队关于可观测性最佳实践。 参与事件响应和事后分析,以持续改进监控结果。 您的能力 计算机科学、软件工程、计算机工程或相关领域的学士学位或更高学历。 3年以上DevOps、SRE、站点可靠性、监控、可观测性或相关角色的经验,并具有可衡量的影响。 必须具备Datadog的实际操作经验,能够在分布式系统中设计监控、警报、仪表板和可观测性实施。 在生产环境中应用Datadog最佳实践的成功记录。 Datadog认证。至少需要Datadog基础认证。 基础设施工具经验: 云平台(Azure)、IaC(Terraform)、CI/CD自动化、容器化(Kubernetes)。 为什么加入Squadric? 与北美顶尖公司合作,参与具有挑战性的项目。 在混合模式下工作,结合灵活性和面对面协作。 加入一个支持性、创新的环境,致力于质量和持续改进。