我们所做的
Zefr 是全球品牌适宜性定位和测量领域的领导者,覆盖全球最大的多个平台。Zefr 的技术通过根据广告商独特的品牌安全和适宜性偏好,让广告商掌控其内容邻接,推动负责任营销时代的到来。作为 YouTube 官方测量计划合作伙伴、Meta for Business 合作伙伴和 TikTok for Business 合作伙伴,公司利用专利的机器学习和人工智能技术(Cognition AI),为品牌和代理商提供更精确和透明的品牌安全和适宜性激活及测量解决方案。公司总部位于加利福尼亚州洛杉矶,并在全球设有多个办事处。
你的工作内容
我们正在招聘一位机器学习运营经理,负责领导我们的 ML Ops 团队,并推动基础设施、工具和流程的发展,使我们的机器学习系统能够大规模运行。你将负责管理处理来自 TikTok、YouTube、Facebook、Instagram 和 Snap 的多 TB 社交媒体平台数据的 ML 模型的部署、监控和优化。在这个角色中,你将领导一个工程师团队,负责构建和维护稳健的 ML 管道,确保生产中模型的可靠性,并实施模型生命周期管理的最佳实践。你将与 ML 工程师和数据科学家密切合作,以弥合研究与生产之间的差距。我们期待欢迎一位对构建可扩展的 ML 基础设施和发展高绩效团队充满热情的领导者。
主要职责
• 领导、指导并发展一支机器学习工程师团队,培养创新和持续改进的文化
• 设计和实施可扩展的 ML 基础设施,用于模型训练、部署和服务
• 建立并执行 ML 模型生命周期管理的最佳实践,包括版本控制、测试和监控
• 开发和维护机器学习工作流程的 CI/CD 管道
• 优化模型推理性能,降低生产系统的延迟/成本
• 与 ML 工程师和数据科学家合作,高效地将模型投入生产
• 为 ML 系统实施稳健的监控、警报和可观测性解决方案
• 推动关于 ML Ops 工具、基础设施和架构的技术决策
• 确保大规模 ML 服务的高可用性和可靠性
• 管理 ML Ops 团队的项目时间表、优先级和资源分配
技术栈
• 语言:Python、SQL
• 数据存储:Snowflake、Qdrant、GCS
• 数据处理:DBT、Pandas、Ray
• DevOps:GitHub Actions、Docker、Terraform、Kubernetes、ArgoCD、AWS、GCP、Datadog
• MLOps:Triton Inference Server、Weights and Biases、ONNX、TensorRT LLM、vLLM、SGLang
• ML:Voxel51 Teams、Transformers、PyTorch、HuggingFace
我们在寻找什么
• 计算机科学或相关领域的学士或硕士学位,拥有 5 年以上 ML 工程或 MLOps 的专业经验
• 2 年以上管理或领导工程团队的经验
• 在 ML 模型部署、服务基础设施和生产 ML 系统方面拥有深厚的专业知识
• 拥有变压器架构(例如 BERT、ViT)在自然语言和视觉任务中的实际经验
• 对整合文本、图像、音频和结构化数据的多模态嵌入技术有深入理解
• 具有使用 LLM 模型(如 Gemini、GPT、Claude、Qwen 等)的经验
• 具有 ML 实验跟踪、模型版本控制和特征存储的经验
• 对应用于 ML 工作流程的 CI/CD 原则有深入理解
• 具有优化模型推理性能(ONNX、TensorRT 或类似)的经验
• 出色的领导能力、沟通能力和利益相关者管理技能
• 在构建和扩展高绩效工程团队方面有成功记录
• 对新技术和创造性解决方案持开放态度
加分项
• 具有广告技术和数字广告生态系统的经验
• 具有多模态 LLM 微调经验
福利(针对美国员工)
• 灵活的带薪休假
• 提供 FSA 选项的医疗、牙科和视力保险
• 公司支付的人寿保险
• 带薪育儿假
• 公司匹配的 401(k)
• 职业发展机会
• 14 天带薪假期
• 灵活的混合工作时间表
• “夏季星期五”(夏季期间某些星期五工作时间较短)
• 办公室午餐和大量免费食物
• 可选的线下和虚拟活动(我们喜欢庆祝!)
薪酬(针对美国员工)
该职位的预期基本工资在 $170,000 到 $230,000 之间。在此范围内,个人薪酬由与工作相关的技能、经验以及相关教育或培训等因素决定。如果你的薪酬期望超出此范围,仍然值得进行一次对话。
Zefr 是一个平等机会雇主,倡导工作场所的多样性和包容性。我们致力于建立一支代表各种背景、技能和观点的团队,因为我们知道这只会让我们变得更好。我们强烈鼓励女性、有色人种、LGBTQIA+ 个人、残疾人士、少数族裔成员、外籍居民和退伍军人申请,即使你不符合 100% 的资格要求。