Hadoop 网站可靠性工程师(SRE)- 数据平台

15个月前全职
Apple

Apple

location 伦敦
unsaved
摘要 发布日期:2024年2月3日 职位编号:200537258 在苹果,人们不仅仅是在制造产品,而是打造了一种经历,彻底改变了整个行业。我们的多样化人员和他们的想法激发了我们在所有领域的创新。想象一下你在这里可以做什么!加入苹果,帮助我们让世界变得更美好。 苹果服务工程(ASE)组织构建并提供支持苹果服务(如iCloud、iTunes、Siri和地图)的系统和基础设施。我们是苹果软件开发人员构建我们的客户喜爱的产品的基础。我们正在寻找热情而有才华的现场可靠性工程师,继续专注于为我们的客户提供最高质量的苹果服务体验。我们的服务必须在全球范围内扩展、保持高可用性,并且“只需工作”。如果你喜欢设计、工程和运行系统和基础设施,将帮助数百万客户,那么这就是你的地方! 关键资格 关键资格 • 通过清晰的沟通和协作表现出的所有权感和诚信感 • 熟练掌握架构、部署、性能调优和故障排除开源数据分析技术,尤其是在大规模环境中的Apache Hadoop和Spark • 具有与安全相关的基础设施经验,包括MIT Kerberos、OpenSSL和证书管理 • 能够使用Go、Python或Java等语言设计、编写和发布代码的能力 • 强烈的自动化手动操作和通过重复迭代改进的驱动力 • 对Linux操作系统、标准网络协议和组件的理解 • 有管理大量不同系统的实际经验,使用配置管理或软件交付平台(如Puppet、Chef、Ansible和Spinnaker) • 部署、支持和监控新的和现有的服务、平台和应用程序堆栈的经验 • 出色的故障排除和问题解决能力 • 具备规模测试、灾难恢复和容量规划经验 描述 描述 苹果云服务基础设施是全球规模的。数据平台现场可靠性工程管理裸金属和云计算平台上的基础设施和应用程序,为苹果的全球产品和组织提供数据处理、治理和存储。我们的平台团队处理的数据量达到了艾字节级、内存量达到了太字节级,并且有数十万个作业,以实现可预测和高性能的数据分析功能,为Apple Music、TV、Maps、News等世界一流产品提供支持。确保这些技术在地理分布的数据中心和平台上协同工作,带来了独特的挑战。作为苹果的SRE,您需要使用经验数据、团队合作和自己独特的专业知识来解决问题。 ASE Hadoop SRE在支持裸金属Linux基础设施上运行许多大型Hadoop集群。我们运行一系列开源、供应商许可和内部开发的工具,您将使用这些工具并有机会对其进行改进。团队致力于通过高可用性架构使Hadoop具有抗故障能力,通过定期调优和分析使其性能优越,并通过定期维护和升级以及适当的作业部署和调优来保持稳定。我们的团队具有合作性,与我们支持的开发团队密切合作,为苹果提供最佳结果。我们思考问题,并努力在面对每个工程挑战时平衡最佳解决方案和完成任务的需求。好的想法会被听到,结果会得到回报。 教育和经验 教育和经验 计算机科学学士/硕士学位或同等学历(在大规模环境中有5年以上的软件开发或生产运营经验) 附加要求 附加要求