站点可靠性工程师/SRE

7小时前全职
2.9万 - 8.9万 / 月 TikTok

TikTok

location 新加坡
unsaved
TikTok 是短视频移动平台的领先目的地。我们的使命是激发创造力并带来快乐。TikTok 在全球设有多个办公室,包括洛杉矶、纽约、伦敦、巴黎、柏林、迪拜、孟买、新加坡、雅加达、首尔和东京。站点可靠性工程(SRE)结合了软件和系统工程,以构建和运行大规模、广泛分布的基础设施。我们的 SRE 负责确保流量服务的可靠性、容错性、高效可扩展性和成本效益。您将有机会管理多种复杂系统,包括为超大规模数据中心和公共云提供服务的流量系统、处理 Tbps 流量的全球负载均衡器等。 职责: • 负责负载均衡器组件的设置、维护和功能发布。 • 负责负载均衡器的事件响应和故障排除。设计、改进并参与灾难恢复计划。在紧急情况下理解并执行最合适的灾难恢复计划。 • 负责指导和支持内部用户使用负载均衡器平台。 • 负责负载均衡器的容量管理。确保负载均衡器的 SLA 和性能,确保数据中心流量入口的质量。 • 研究、设计和开发计算机和网络软件或专业实用程序。 • 分析用户需求并开发软件解决方案,应用计算机科学、工程和数学分析的原理和技术。 • 更新软件,增强现有软件功能,并开发和指导软件测试和验证程序。 • 与计算机硬件工程师合作,集成硬件和软件系统,并制定规范和性能要求。 最低资格: • 计算机科学、信息技术、编程与系统分析、科学(计算机研究)等相关学科的学士学位。 • 至少 5 年工作经验。 • 具有从 CDN 到负载均衡器及更高层次的流量系统的工作经验。 • 了解网络基础设施和/或路由。 • 具有 Layer 4 / Layer 7 负载均衡器的经验。 • 了解包括 TCP/IP、HTTP、RPC、TLS 等协议。 • 具有容器化环境的工作经验。 • 熟悉一种或多种编程语言,如 Java、C++、Go,或 Shell 和 Python 的脚本经验。 • 自我驱动,能够应对模糊情况,并将项目从概念推进到交付。 • 具备较强的分析能力,能够在快速变化的环境中解决现实问题。 优先资格: • 具有为大规模系统设计、分析和构建自动化和工具的经验。 • 具有使用 AWS、Google、Azure 和其他云服务构建解决方案的经验。 • 在承载级环境中具有 TCP/IP、HTTP、DNS 等网络技术的经验。 • 具有开发和操作以下系统之一或多个的经验:Kubernetes、Nginx、ipvs、ELK 堆栈等。 • TikTok 致力于创造一个包容的空间,在这里员工的技能、经验和独特视角受到重视。我们的平台连接着全球各地的人们,我们的工作环境也是如此。在 TikTok,我们的使命是激发创造力并带来快乐。为了实现这一目标,我们致力于庆祝我们多样的声音,创造一个反映我们所接触的众多社区的环境。我们相信,个人不应因其背景或身份而处于劣势,而应根据他们的优势和经验进行评估。我们对此充满热情,希望您也是如此。 工作类型:全职 薪资:每月 $5,098.52 - $15,736.68 福利: • 提供餐食 • 健康保险 工作时间: • 日班 • 周一至周五 补充薪资: • 加班工资 经验: • 从 CDN 到负载均衡器及更高层次的流量系统:1 年(优先) • 网络基础设施和/或路由:1 年(优先) • 容器化环境:1 年(优先) • Kubernetes、Nginx、ipvs、ELK 堆栈中的任意一个:1 年(优先) • 大规模系统的设计、分析:1 年(优先) 工作地点:现场