关于StackOps
StackOps是一个基于云的监控工具,专为新加坡政府整体(WOG)部门设计。它使各机构能够利用站点可靠性工程(SRE)实践来增强可观察性、集中日志管理、数据聚合和可视化,以及在其云基础设施和应用程序中实现强大的安全功能。通过采用StackOps,政府机构可以实现:
- 提高应用程序可靠性
- 简化运营流程
- 增强云安全性
- 改善应用程序性能
- 提高运营效率
关于职位
我们正在寻找一位才华横溢的DevOps工程师加入我们的团队,在StackOps的持续开发、维护和支持中发挥关键作用。您将负责确保平台的可扩展性、性能和安全性,并与开发人员、运营人员和政府机构合作。
职责
- 参与StackOps平台新功能、功能的设计、开发和部署以及维护。
- 与DevOps工程师合作,管理监控解决方案的配置和集成(例如Elastic Cloud、AWS、Azure、GCP等)。
- 实施和维护StackOps平台的安全性、可扩展性和性能的最佳实践。
- 主动识别和实施改进措施以增强平台的可扩展性和可靠性。
- 为使用StackOps的政府机构提供技术支持,包括入职、故障排除和配置指导。
- 及时了解与StackOps相关的最新云技术和监控最佳实践。
- 不断改进文档并为StackOps用户开发培训材料。
资格
- 在平台工程、云运营或相关领域有验证的经验
- 对监控工具、方法和配置管理有深入理解
- 具有基础设施自动化工具的经验(例如Ansible、Terraform)
- 熟悉DevOps原则和实践
- 优秀的问题解决和分析能力
- 能够独立工作并作为团队的一部分
- 良好的沟通和协作能力
加分项
- 具有OpenTelemetry实施经验
- 具有StackOps或类似监控平台的经验
- 在政府IT环境中工作的经验
- 精通NodeJS、Python或Go等语言的编程