岗位的典型日常工作:
• 管理我们的公共云平台(Google和Azure)上关键基础设施平台的可靠性
• 提高和维护站点的可用性、可扩展性、服务和系统性能
• 调查系统错误和问题,进行大规模系统的瓶颈分析等
• 提供性能管理、灾难恢复、监控和访问管理的解决方案
• 参与解决方案设计会议
• 参与计划和回顾会议,参加站立会议等
• 构建和运营高可用性和可扩展性的软件和基础设施。
• 支持应用团队使用平台,包括提供设计模式、最佳实践和安全考虑的指导。
• 我们的团队灵活而快速 - 您将被要求每天进行同行评审和质量控制。
• 参与值班轮班(每7周一次,值班1周)。
候选人要求/必备技能:
1. 8年以上的系统管理经验和/或企业运营技能
2. 3-5年以上的操作系统经验(RHEL 7.X和Windows 2K12及以上)
3. 2年以上的任何以下语言开发经验(Java、Javascript、Python、Ruby、Go、C#)
4. 2年以上支持GCP和/或Azure的经验;以及Kubernetes(GKE和AKS)的经验
5. 您对敏捷和精益方法论的需求/设计方法有很强的了解
Nice-To-Have 技能:
• 软件设计模式、基础架构架构、DevOps或安全考虑的知识。
• 在持续集成系统(Jenkins、Travis、CircleCI等)中设计和实施任务的经验。
• 了解软件发布过程(环境、二进制存储库、CI/CD)。
• 在Tanzu(PCF)、Pipelines和其他云开发平台上设计和实施任务的经验
• 支持容器、容器编排平台的经验。
• 网络工程知识 - DNS、TCP/IP、负载均衡、DMZ、路由协议等。
• 云安全知识 - 密钥管理、证书基础设施/PKI、安全编码实践等。
• Terraform的经验
• 流利的西班牙语能力
教育背景:
• 计算机科学、计算机工程或相关IT领域的技术类本科学位是一个优势