机器学习工程师 - 平台,货币化生成式人工智能

14天前全职
145K - 250K USD / 年 TikTok

TikTok

location 纽约
unsaved
职责 TikTok 是短视频移动平台的领先目的地。我们的使命是激发创造力并带来快乐。TikTok 的全球总部位于洛杉矶和新加坡,办公室包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京。 为什么加入我们 创造是 TikTok 的核心使命。我们的平台旨在帮助想象力蓬勃发展。对于使 TikTok 成为可能的团队来说,这一点更是如此。 我们共同激发创造力,带来快乐 - 这是我们都相信并努力实现的使命。 对我们来说,每一个挑战,无论多么困难,都是一个机会;学习、创新和作为一个团队共同成长。现状?绝不。勇气?永远。 在 TikTok,我们共同创造,共同成长。这就是我们推动影响力的方式 - 为我们自己、我们的公司和我们服务的社区。 加入我们。 关于生成式人工智能生产团队 生成式人工智能生产团队下的后训练小组处于前沿,专注于为广告、内容创作等领域精炼和增强生成式人工智能模型。我们的使命是对预训练模型进行微调,以在垂直广告类别和多模态应用中实现最先进(SOTA)的性能。我们通过微调、强化学习和领域适应来优化模型,确保 AI 生成的内容符合最高质量和相关性标准。 我们与预训练团队、应用团队和多模态模型开发者(T2V、I2V、T2I)紧密合作,将基础 AI 进展与现实世界的高性能应用相结合。如果您热衷于推动认知边界、优化 AI 模型并将 AI 生成的内容提升到新高度,这就是适合您的团队。 作为机器学习平台工程师,您将推动我们的 AI 平台开发,确保大规模扩散模型和多模态生成式人工智能系统的可扩展性、效率和稳健性。您将与模型研究人员、基础设施工程师和数据团队密切合作,优化分布式训练、推理效率和生产可靠性。 职责 • 架构和开发可扩展和高效的 AI 基础设施,以支持大规模扩散模型和多模态生成式人工智能工作负载。 • 使用 PyTorch、Triton、TensorRT 和分布式训练库(DeepSpeed、FSDP、vLLM)优化大型模型的训练和推理。 • 使用序列并行、管道并行和张量并行等技术实现和优化模型,以提高高吞吐量训练集群的性能。 • 扩展和生产化生成式人工智能模型,确保在异构硬件环境(H100、A100 等)上的高效部署。 • 开发和集成模型蒸馏技术,以提高生成模型的效率和性能,降低计算成本,同时保持质量。 • 设计和维护自动化模型生产管道,以便大规模训练/推理,集成分布式数据处理框架(Ray、Spark 或自定义解决方案)。 • 通过优化模型编排、检查点和检索策略来增强平台的稳定性和效率。 • 与跨职能团队(ML 研究人员、软件工程师、基础设施工程师)合作,确保无缝的模型迭代周期和部署。保持对深度学习架构、分布式训练技术和 AI 基础设施优化的新兴趋势的前瞻性,整合来自学术界和行业的最佳实践。 资格 最低资格: • 计算机科学、电气工程或相关领域的学士、硕士或博士学位。3年以上大规模机器学习基础设施和分布式 AI 模型训练的实际经验。 • 深入掌握 PyTorch、CUDA 优化以及 DeepSpeed、FSDP 和 vLLM 等 ML 框架。在优化扩散模型、序列并行和大规模基于变换器的架构方面有成功经验。 • 对高性能计算、低延迟推理和 GPU 加速技术有深入理解。 • 在扩展 AI 基础设施方面有实际经验,利用 Kubernetes、Docker、Ray 和 Triton 推理服务器。深入理解大型集群上的 AI 模型编排、调度和优化。精通分析和调试大规模模型训练和推理瓶颈。 优先资格: • 有在生产环境中部署多模态生成式 AI 模型的经验。 • 在编译器级优化、TensorRT 和硬件感知模型调优方面的专业知识。 • 熟悉云环境中的大规模 AI 工作负载(AWS、GCP、Azure)。 • 强大的软件工程背景,关注可扩展性、效率和可靠性。 TikTok 致力于创造一个包容的空间,让员工因其技能、经验和独特视角而受到重视。我们的平台连接来自全球的人们,我们的工作环境也是如此。在 TikTok,我们的使命是激发创造力并带来快乐。为了实现这一目标,我们致力于庆祝我们多样的声音,并创造一个反映我们所接触的众多社区的环境。我们对此充满热情,并希望您也是。 TikTok 承诺在招聘过程中为残疾候选人、怀孕者、真诚持有的宗教信仰者或其他受适用法律保护的原因提供合理的便利。如果您需要协助或合理的便利,请通过 https://shorturl.at/cdpT2 联系我们。 职位信息 【薪酬透明】薪酬描述(年) 该职位在选定城市的基本薪资范围为每年 145000 - 250000 美元。 薪酬可能会因多种因素而在此范围之外变动,包括候选人的资格、技能、能力和经验,以及地点。基本薪酬是提供给员工的总薪酬的一部分,用于补偿和认可他们的工作,并且该职位可能有资格获得额外的酌情奖金/激励和限制性股票单位。 福利可能会因雇佣性质和工作地点的国家而异。员工从第一天开始即可享受医疗、牙科和视力保险,401(k) 储蓄计划(公司配比)、带薪父母假、短期和长期残疾保险、生命保险、健康福利等。员工每年还享有 10 天带薪假期、10 天带薪病假和 17 天带薪个人假(按雇佣时按比例计算,随着任期的增加而增加)。 公司保留随时修改或更改这些福利计划的权利,恕不另行通知。 对于洛杉矶县(未合并)候选人: 符合条件的申请者如有逮捕或定罪记录,将根据所有联邦、州和地方法律,包括洛杉矶县公平机会法令和加利福尼亚公平机会法案,考虑其就业。我们的公司相信,犯罪历史可能与以下工作职责直接、不利和负面相关,可能导致撤回有条件的就业录用通知: • 与内部/外部客户和/或同事互动并偶尔与之进行无监督接触; • 适当地处理和管理机密信息,包括专有和商业秘密信息以及对信息技术系统的访问;以及 • 行使良好的判断力。