高级软件工程师,机器学习基础设施与分布式系统

洛杉矶 8天前全职 网络
面议
关于职位: 作为ML基础设施团队的员工软件工程师,您将与机器学习和产品团队密切合作,构建世界级的机器学习推理平台。这些平台支持Tubi的个性化推荐、搜索和内容理解等基本服务。 该团队的核心职责是开发和维护支持深度学习、LLM和搜索模型的低延迟ML模型服务系统。这涉及构建自助基础设施和关键组件,如推理引擎、特征存储、向量存储和实验引擎。 您将改进我们部署和操作服务的方式,甚至为开源项目做出贡献。此角色赋予架构自由,探索新框架,领导关键的跨职能项目,并转变我们ML和产品团队的能力。 职责: - 使用Scala设计和构建可扩展、高吞吐量和低延迟的分布式系统 - 构建可重用的组件和服务,服务于个性化、搜索、广告和探索等各种ML应用 - 与ML工程师紧密合作,了解他们的挑战和限制,并开发可扩展的解决方案来解决这些问题。主动推荐解决方案以保持我们的ML推理堆栈的先进性。 - 采用数据驱动的方法识别和优化我们基础设施的延迟、成本和效率。如有必要,领导大规模跨职能重构 - 指导团队中的其他工程师关于系统设计、有效的事件管理、面试、利用LLM进行工作等 - 与ML、产品和跨职能工程团队合作,定义Tubi的ML基础设施的长期愿景和架构。 您的背景: - 8年以上使用任何现代后端语言(如Scala、Java、Python、Go、C++)设计和构建可扩展、分布式系统的经验;有Scala或基于JVM语言的经验者优先。 - 拥有AWS或等效云平台的丰富经验 - 有大规模低延迟在线微服务构建经验 - 有SQL(如Postgres)和NoSQL数据库(如Cassandra)、消息代理(如Kafka)和缓存(如Redis)的经验 - 具备容器化技术经验,如Docker或Kubernetes - 领导多次重大大规模事件的响应和解决工作 加分项: - 熟悉机器学习基础设施,如推理引擎(如torschserve、triton、vLLM)、向量存储(如LanceDB、FAISS)、特征存储(如Feast)、ElastiCache、模型训练编排等 - 理解ML模型训练管道和模型内部。具有推荐系统、搜索、自动补全和广告ML经验者优先 - 之前有Akka、Erlang、Elixir或Go的经验 - 精通复杂A/B测试结果的数据驱动分析 关于Tubi: Tubi是一项免费流媒体服务,为超过1亿月活跃用户提供娱乐。Tubi提供全球最大的好莱坞电影和电视节目收藏,数以千计的创作者主导的故事和数百个为最热情的粉丝制作的Tubi原创作品。Tubi总部位于旧金山,成立于2014年,是福克斯公司旗下Tubi媒体集团的一部分。 根据州和地方的薪酬披露要求,此职位的薪酬范围(最终报价金额取决于教育、技能、经验和地点)每年列在下面。此职位还符合年度酌情奖金、长期激励计划和各种福利,包括医疗/牙科/视力保险、401(k)计划、带薪休假和其他符合适用计划文件的福利。 高成本劳动力市场,如洛杉矶、纽约市和旧金山 $227,200—$324,500美元 Tubi是福克斯公司的一个部门,这里总结的FOX员工福利涵盖了大多数美国员工福利。以下区别概述了Tubi和FOX福利之间的差异: - 对于美国非豁免的Tubi员工,FOX员工福利总结准确地捕捉了假期和病假时间。 - 对于所有有薪/豁免员工,Tubi提供灵活的休假政策以管理所有个人事务,而不是FOX的假期政策。 - 对于所有全职、正式员工,Tubi提供慷慨的育儿假计划,允许父母在孩子出生、收养、代孕或寄养的第一年内享受十二(12)周的带薪陪伴假,此外还有适用的政府假期计划和FOX的短期残疾政策。此时间通过任何适用的州、市和联邦假期和工资替代计划以及Tubi的贡献组合100%支付。 - 对于所有全职、正式员工,Tubi提供每月健康报销。 关于Tubi: 大胆为每个粉丝群体打造,Tubi是一项免费流媒体服务,为超过1亿月活跃用户提供娱乐。Tubi提供全球最大的好莱坞电影和电视节目收藏,数以千计的创作者主导的故事和数百个为最热情的粉丝制作的Tubi原创作品。Tubi总部位于旧金山,成立于2014年,是福克斯公司旗下Tubi媒体集团的一部分。 我们是一个平等机会的雇主,所有合格的申请者将不分种族、肤色、宗教、性别、国籍、性别认同、残疾、受保护的退伍军人身份或任何其他法律保护的特征而获得就业考虑。我们将根据适用法律考虑有犯罪记录的合格申请者的就业。