高级站点可靠性工程师(SRE / DevOps)

新加坡 1天前全职 网络
3.8万 - 5.5万 / 月
主要职责 • 管理全球游戏/直播系统的日常运营、部署、监控和事件响应 • 与工程、质量保证和产品团队合作,快速诊断和解决生产问题,确保高服务可用性(符合SLA) • 分析系统性能并优化全球各地区的网络质量 • 监督生产数据库的健康状况:进行常规检查,管理备份和恢复,优化慢查询,并进行容量规划 • 实施和维护监控和警报系统,以确保基础设施的可观察性 • 使用Shell或Python等脚本语言自动化操作任务和工作流程 • 支持容量规划、成本优化和灾难恢复准备 • 参与轮班待命,以支持24/7系统正常运行 要求 • 5-7年在互联网、游戏或直播行业的DevOps、SRE或基础设施运营相关经验 • 强大的Linux系统管理和故障排除技能 • 精通基础设施脚本(Shell/Python)和自动化 • 具有生产数据库管理(如MySQL/PostgreSQL)的扎实经验,包括调优、扩展和灾难恢复 • 熟悉全球云基础设施提供商,如AWS和阿里云 • 具有为海外市场构建网络可观察性和监控系统的经验 • 具备容器技术(如Docker、Kubernetes)和CI/CD管道的工作知识 • 有支持24/7关键任务环境或参与待命职责的经验是一个很大的优势 我们提供 • 成为面向新兴市场的高影响力全球产品团队的一员 • 具有竞争力的薪酬和基于绩效的奖金 • 成长为基础设施领导角色的机会 • 动态、包容和技术前沿的工作环境 📩 申请方式:请将您的简历发送至hr@mozat.com 只有入围的候选人会被联系。