这是一个领导角色,团队管理经验是必需的
高级工程师将负责DevSevOps云操作基础设施和平台,包括可用性、性能、容量、安全性和可用性。
高级工程师将为初级团队成员提供技术领导,并向管理层提供技术报告。
作为一名高级工程师,您将与IT组织的其他团队保持密切的工作关系,包括开发、企业IT、企业架构和服务交付。利用与开发和运营团队的紧密合作关系,推广DevOps文化和最佳实践。
您将确保您的技术团队拥有成功所需的工具和行为,指导那些在技术和流程相关领域需要支持的人员。
作为IT运营团队的一部分,您将积极参与将传统产品和平台迁移到新的云托管平台的工作,同时确保无法重新架构的产品仍然正常运行。
• 重新平台化工作的主要目标将是AWS,该角色的一部分将包括领导和报告工具可行性和实施工作。
• 作为一个新成立的团队的新成员,您的意见和建议也将被征求关于未来云架构的长期视图。
• 主要职责
• 推广和展示培养GFL文化的行为。
• 加入并参与我们的CloudOps工程师的日常工作。
• 根据需要参与关键事件和故障恢复的轮班。
• 在内部推广和指导敏捷、Scrum和精益方法论。
• 为持续改进做出贡献,不断审查流程并识别可以通过自动化改进的瓶颈。
• 为团队内使用的工具和平台提供技术领导,作为2-3个工具的专家。
• 教育和指导IT组织中的其他成员,这些成员曾是传统数据中心IT组织的一部分,对现代云架构和云工具/方法不熟悉。
• 向管理层提供每周报告,报告项目状态、技术债务和工作项。
• 为新的和初级团队成员的入职和培训做出贡献。
• 确保所有声音都被听到,并且人们被尊重对待。
• 持续关注公司和技术堆栈的变化。
• 领先技术或管理合理要求的其他活动。
知识、技能和能力
• 开发和维护:在AWS上开发和维护可扩展、可靠和安全的云基础设施。利用Terraform进行基础设施即代码,确保云资源的可复制性和版本控制。
• 自动化和优化:使用Terraform、Ansible等工具自动化部署、扩展和管理流程。为成本、性能和安全性优化云资源。
• 部署管道管理:构建和维护持续集成和持续部署(CI/CD)管道,以促进快速且安全的代码部署。
• 可观察性和故障排除:使用AWS CloudWatch、Prometheus和Grafana等工具实施监控解决方案。主动识别和排除基础设施问题。在云原生基础设施中调试和排除复杂问题。
• 安全和合规性:确保遵守安全最佳实践和合规标准,包括管理IAM角色和策略,以及实施安全组和网络ACL。
• 灾难恢复和高可用性:设计和实施灾难恢复策略。确保服务和基础设施的高可用性。
• 培训和发展:持续培训和个人发展。需要云和DevOps认证。了解行业最佳实践和有效工具。