概述
在Squadric,我们与组织合作,构建现代化、可扩展和智能的技术解决方案。我们正在寻找一名Datadog专家来担任合同职位。
该角色将作为Datadog方面的主题专家(SME),引领我们如何监控、警报和观察复杂的基础设施和应用程序。
您将与工程师、SRE和领导层紧密合作,设计可观测性策略,推进最佳实践,并推动可衡量的性能洞察。
这是一个混合角色,每周需要在办公室协作两天,地点在不列颠哥伦比亚省的萨里或阿尔伯塔省的卡尔加里,其余工作可远程进行。
角色概述
虽然根植于DevOps,但该职位更侧重于使用Datadog进行监控、警报、仪表板和可观测性策略,而不仅仅是一般的Ops职责。
您的经验将指导我们的客户如何采用和扩展监控实践,以实现可靠性、性能和以客户为中心的结果。
您的工作内容
作为团队内部Datadog的首选专家。
设计、实施、配置和优化Datadog环境,包括指标收集、仪表板、监控/警报和日志记录。
在Datadog中建立标记实践、警报阈值、SLI/SLO和可视化标准。
在基础设施、应用程序、微服务、容器和云平台上引领可观测性策略。
提出改进和操作最佳实践,以提高可靠性并减少警报疲劳。
构建、维护和微调Datadog监控和警报,以确保对事件的主动响应。
与工程团队合作,将业务和操作优先事项转化为可观测性需求。
使用日志、指标、跟踪、事件和自定义仪表板进行故障排除。
支持CI/CD管道、自动化和基础设施即代码(IaC),如适用。
指导和教育DevOps/SRE/工程团队关于可观测性最佳实践。
参与事件响应和事后分析,以持续改进监控结果。
您的能力
计算机科学、软件工程、计算机工程或相关领域的学士学位或更高学历。
3年以上DevOps、SRE、站点可靠性、监控、可观测性或相关角色的经验,并具有可衡量的影响。
必须具备Datadog的实际操作经验,能够在分布式系统中设计监控、警报、仪表板和可观测性实施。
在生产环境中应用Datadog最佳实践的成功记录。
Datadog认证。至少需要Datadog基础认证。
基础设施工具经验:
云平台(Azure)、IaC(Terraform)、CI/CD自动化、容器化(Kubernetes)。
为什么加入Squadric?
与北美顶尖公司合作,参与具有挑战性的项目。
在混合模式下工作,结合灵活性和面对面协作。
加入一个支持性、创新的环境,致力于质量和持续改进。