总结
想象一下你在这里可以完成什么。带着你的热情、创造力和奉献精神,这里没有你无法实现的目标。这不仅仅是另一个 SRE 职位——这是一个帮助重新定义超大规模可靠性工程实践的机会。我们的团队正在构建能够自主运行苹果核心信息安全系统的平台,为关键服务的管理设定新的标准。
描述
我们正在寻找在可靠性、软件开发和自动化交汇处茁壮成长的优秀工程师——那些致力于突破可能性界限的人。理想的候选人具备现代 SRE 实践的坚实基础,并且有设计和实施解决运营挑战的软件的成功经验。您将使用最先进的工具和方法开辟新天地,开发的自动化不仅能跟上规模,还能预测、反应并领先于它。您将与安全工程、威胁检测、事件响应和其他内部职能部门密切合作,以确保支持我们网络安全任务的工具和基础设施的可扩展性、可用性和安全性。加入我们,帮助在世界上最具创新力的公司之一构建自我管理系统的未来。
职责
• 激励、指导并培养一支高绩效的 SRE 团队,致力于自动化和扩展苹果的核心安全平台。
• 通过建立弹性的监控、警报和自动化修复实践来倡导卓越运营,最大限度地减少停机时间和手动工作。
• 推进基础设施即代码和自动化,消除繁琐工作,提高一致性,加速安全、可靠服务的交付。
• 与信息安全利益相关者紧密合作,将安全需求转化为可扩展、可支持和高性能的解决方案。
• 负责关键安全系统的可靠性——包括 SIEM、SOAR、遥测和漏洞管理——确保可用性、性能和容量与业务需求保持同步。
• 自信地领导事件响应,推动解决中断和基础设施问题,同时培养无责备、以学习为导向的文化。
• 为信息安全服务定义和执行 SLO/SLI,使用数据衡量成功并不断改进。
• 跨工程和 IT 部门合作,在 CI/CD、容器化和服务编排中嵌入最佳实践。
• 坚持强有力的安全卫生和合规性,符合内部标准和外部监管要求。
• 为团队设定方向和优先事项,管理资源、时间表和计划,以最大化影响。
最低资格
• 5 年以上 SRE 或服务基础设施角色的经验,包括 2 年以上的领导或管理角色经验
• 对现代 SRE 实践有深入理解,包括可观察性、自动化和可靠性工程
• 具有云平台(AWS、GCP)和基础设施即代码工具(Pulumi、Terraform、Ansible 等)的经验
• 熟悉容器技术(Docker、Kubernetes)和 CI/CD 流水线
• 出色的沟通能力,能够跨技术和非技术团队进行合作
优先资格
• 计算机科学或相关领域的学士学位,或同等的实践经验
• 之前在信息安全团队工作或与之密切合作的经验
• 能够用 Python、Go、Swift 或其他脚本语言编写和审核代码
• 具有 Scrum/Agile 开发方法的操作经验
• 能够营造强调协作、责任和卓越的环境
• 管理支持信息安全功能的系统的经验(例如,安全监控、日志聚合、扫描工具)
• 能够在压力下工作并在动态工作环境中管理困难情况
• 对高质量代码、单元测试、文档和生产服务的热情
• 之前在具有 24/7 支持模式的全球团队工作的经验
苹果是一个致力于包容和多样性的平等机会雇主,因此我们公平对待所有申请人。苹果致力于与身体和精神残疾的申请人合作并提供合理的便利。