职责:
• 根据设计规范部署弹性和可扩展的计算解决方案
• 在AWS上使用Multi-AZ和负载均衡器部署高可用系统
• 部署备份和恢复解决方案以满足SLA
• 处理来自Cloudwatch监控的警报
• 通过云上支持的方法对系统进行恢复
• 与其他内部利益相关者合作构建可靠和可扩展的云基础设施(DevOps)
• 维护与安全、法规合规性和成本相关的现有云基础设施政策
• 故障排除事件,识别根本原因,修复和记录问题,并实施预防措施。对事件进行根本原因分析,并为事后评估做出贡献
• 设计和开发系统和工具,以自动化和编排云环境
• 与开发和安全团队合作,确保遵循最佳实践
要求:
• 计算机科学/信息系统或其等同学历相关资格
• 专业认证将增加附加值
• 对核心AWS云技术有深入的理解
• 在AWS云上进行运营/管理和部署/迁移项目的至少5年专业经验
• 有Azure或Google Cloud的经验将是有优势的。
• 有操作系统(Windows或Linux)和网络管理的经验
• 云相关的脚本知识用于自动化
• 有自动化(基础设施即代码,配置即代码)的经验
• 有API、编排、容器化的经验
• 在完成工作方面有足够的资源
• 具有与内部和外部利益相关者良好合作的有效人际交往能力
• 在团队环境中有效工作