要求
- 必须在美国拥有合法的永久居留权,
- 8年以上软件工程经验,重点关注分布式系统、云原生应用和微服务,
- 拥有使用AWS或GCP等云服务提供商的实际经验,
- 对TCP/IP、DNS、DNSSEC及相关网络协议有深入了解,
- 具有使用一种或多种编程语言(例如Go、Ruby、Python、C/C++)构建工具、自动化或服务的成功经验,
- 拥有丰富的基础设施即代码(Terraform, CloudFormation)经验,
- 具有在Linux上部署、操作和调试服务器软件的经验,
- 具备较强的人际交往和沟通能力;能够向设计师、支持人员和工程师解释复杂的技术概念,
- 拥有计算机科学、工程或相关技术领域的学士、硕士或博士学位(或同等工作经验),
- (优先考虑)在AWS生态系统(NLB, VPC / IAM / S3 / EC2)中有领域专长,
- (优先考虑)有参与或运营大规模、高可用性生产系统的经验,
- (优先考虑)了解DDoS检测/缓解策略和自动化框架,
- (优先考虑)对云规模的成本优化和运营效率感兴趣
工作内容
- 云网络团队是一个分布在澳大利亚、美国和加拿大的全球系统和软件工程师团队,负责为全球超过1700万日活跃用户提供快速可靠的Slack服务,
- 我们管理Slack的AWS云生态系统,并提供支持Slack大规模运营的基础网络、账户和身份访问以及基础设施即代码平台,
- 我们的工作涵盖入口负载均衡和智能流量管理,包括我们自己的软件负载均衡器、云负载均衡基础设施、DNS和CDN服务,
- 我们还设计和运营DDoS检测和自动化缓解系统,确保Slack在大规模威胁面前保持弹性,
- 我们是一个小团队,但影响巨大。我们快速迭代并与工程中的其他团队紧密合作,确保构建的系统具有可扩展性和弹性,
- 我们对质量有强烈的承诺,并理解简单性和可靠性应该是我们构建系统的主要方面。可靠性是Slack最关键的特性!
- 这是一个全职的美国本土工程职位,
- 设计、构建和操作支持Slack全球云网络堆栈的系统,包括入口/出口负载均衡、服务到服务网络、DNS、CDN和流量管理,
- 开发和自动化检测、缓解和响应系统,以防御DDoS和其他大规模网络威胁,
- 为基础设施即代码和自动化框架做出贡献,以提高可靠性、可重复性和效率,
- 在基于Linux的环境中排除应用、分布式系统和网络的复杂问题,
- 与AWS和其他工程团队紧密合作,扩展Slack的全球基础设施并采用新的云技术,
- 通过快速迭代设计和跨工程团队协作,推动系统可观测性、可靠性和易用性的改进,
- 参与值班轮班,以确保关键Slack基础设施的可用性和弹性