经理,AWS 云运营

纽约 5天前全职 网络
83.5万 - 111.3万 / 年
职位概要: AWS云运营经理负责管理和优化托管在Amazon Web Services(AWS)上的云基础设施,以确保高可用性、安全性和性能。该角色监督日常运营,包括监控、自动化、成本管理和事件响应,同时领导云运营工程师团队并与各部门协作。AWS云运营经理还在确保可扩展性、实施安全最佳实践以及将云运营与业务目标对齐方面发挥关键作用。 重点领域包括资源优化、灾难恢复、合规性,以及通过DevOps实践推动自动化和基础设施改进。该职位需要对AWS服务、云管理工具和云安全协议有深入了解,以确保基础设施符合公司的性能和安全标准。 职位:AWS云运营经理 部门:技术支持 工作时间:全职 基本职责/任务: - 云基础设施管理:监督AWS基础设施和服务(EC2、S3、RDS、Lambda等)的设计、部署和管理。确保云环境的可用性、可靠性和可扩展性。管理和监控AWS资源,确保最佳性能和成本效率。进行容量规划并实施自动扩展策略以应对流量波动。 - 监控和事件管理:设置和维护监控工具(如Amazon CloudWatch、AWS CloudTrail)以跟踪云资源的健康状况和性能。响应事件并在AWS环境中排除故障,以确保最小停机时间。 - 安全和合规:执行AWS安全最佳实践。确保符合HIPAA合规性和公司关于数据安全和隐私的政策。与安全团队合作,定期评估和增强安全政策。 - 成本优化:分析和优化AWS支出,实施成本控制策略,如预留实例、现货实例和资源调整。提供云成本和资源使用报告,并推荐节省成本的策略。使用AWS Cost Explorer和Trusted Advisor等工具监控支出并识别低效。 - 团队领导和协作:领导和管理负责AWS基础设施的云运营工程师团队。与基础设施、网络、集成和安全团队协作,以使AWS运营与业务目标保持一致。 - 为团队成员提供技术指导和指导,确保遵循最佳实践和AWS标准。 - 自动化和DevOps:推动使用AWS CloudFormation等工具采用基础设施即代码(IaC)。自动化云资源的部署、扩展和管理,以简化操作并减少手动干预。为Landing Zone Accelerator软件发布集成CI/CD管道。 - 备份:确保为关键AWS服务(如RDS、EBS快照)配置备份,并满足业务连续性要求。 - 性能调优和优化:持续监控和调整云服务的性能,以满足应用程序和工作负载要求。确保关键企业系统的稳定性能环境。 - 文档和报告:维护AWS环境的全面文档,包括架构图和操作程序。向管理层提供有关系统性能、事件和正在进行的操作任务的定期状态报告。 - 应用迁移:与基础设施、网络、集成和安全团队合作,将临床和业务应用从本地数据中心迁移到AWS。 - 云运营卓越中心:建立基于职位级别的培训课程和相应的认证矩阵。 - 按指示参加变更管理和根本原因分析会议。 - 主动研究和寻找必要的工具和流程,以识别发展中的问题趋势;分析趋势并制定旨在解决问题并防止其再次发生的长期计划;为用户社区保持高服务水平。 - 参与各种IT项目 - 与部门和业务部门经理以及项目经理和领导者沟通,以定义支持计划和解决方案 - 与组织各级人员互动 - 与IT组织其他领域的同事保持有效的工作关系,这对于维护良好的公共关系、促进沟通和征求有用的反馈至关重要 - 与外部供应商保持合作关系,这将有助于增强服务交付能力 - 与专业组织、同行团体和行业贸易团体建立关系,以保持技术的最新状态 - 保持专家级的技术知识。 - BMC管理层分配的其他职责 - 可能需要在非工作时间、周末和假期提供技术支持。 - 需要随时携带寻呼机。 (上述职位描述中的陈述旨在描述分配给该职位员工的工作的一般性质和水平。上述内容并非旨在代表所需职责和责任的详尽清单)。 职位要求 教育: - 需要计算机科学、工程或相关学科的学士学位。 证书、执照、注册要求: - 需要AWS认证,优先考虑:AWS认证解决方案架构师和AWS认证SysOps管理员。 经验: - 五年管理云运营团队的经验。需要至少8年AWS运营或工程角色的经验。 - 需要具有监控、自动化和云管理工具(CloudWatch、CloudFormation、Terraform、Jenkins)的经验。 知识、技能和能力(KSAs): - 深入了解AWS服务、架构和最佳实践。 - 对云安全、治理和合规标准有深入理解。 - 优秀的问题解决、故障排除和事件管理技能 平等机会雇主/残疾人/退伍军人