主要职责
• 管理全球游戏/直播系统的日常运营、部署、监控和事件响应
• 与工程、质量保证和产品团队合作,快速诊断和解决生产问题,确保高服务可用性(符合SLA)
• 分析系统性能并优化全球各地区的网络质量
• 监督生产数据库的健康状况:进行常规检查,管理备份和恢复,优化慢查询,并进行容量规划
• 实施和维护监控和警报系统,以确保基础设施的可观察性
• 使用Shell或Python等脚本语言自动化操作任务和工作流程
• 支持容量规划、成本优化和灾难恢复准备
• 参与轮班待命,以支持24/7系统正常运行
要求
• 5-7年在互联网、游戏或直播行业的DevOps、SRE或基础设施运营相关经验
• 强大的Linux系统管理和故障排除技能
• 精通基础设施脚本(Shell/Python)和自动化
• 具有生产数据库管理(如MySQL/PostgreSQL)的扎实经验,包括调优、扩展和灾难恢复
• 熟悉全球云基础设施提供商,如AWS和阿里云
• 具有为海外市场构建网络可观察性和监控系统的经验
• 具备容器技术(如Docker、Kubernetes)和CI/CD管道的工作知识
• 有支持24/7关键任务环境或参与待命职责的经验是一个很大的优势
我们提供
• 成为面向新兴市场的高影响力全球产品团队的一员
• 具有竞争力的薪酬和基于绩效的奖金
• 成长为基础设施领导角色的机会
• 动态、包容和技术前沿的工作环境
📩 申请方式:请将您的简历发送至hr@mozat.com
只有入围的候选人会被联系。