关于职位
我们正在寻找经验丰富的人工智能基础设施工程师,设计并实现强大且可扩展的管道,以处理大规模数据工作负载。加入 Tether 的应用研究团队,您将为跨越数千个 GPU 的高影响力项目做出贡献,推动前沿视频生成基础开发。
职责:
• 构建并扩展高吞吐量数据基础设施,优化视频和多模态内容处理,适用于大型 GPU 集群(例如 H100/H200)。
• 设计视频、音频、文本和图像模态的核心预处理算法,实现时间数据的高效提取、同步和标准化。
• 构建自动化获取管道,以源源不断地获取大规模视频数据集,处理不同格式、帧速率、注释和嵌入音频。
• 架构强大的系统,以支持可扩展的评估和注释,包括基于提示的评分、感知指标、字幕生成和基于检索的诊断。
• 与模型研究人员合作,共同设计视频模型架构(例如 DiTs、VAEs、时空变换器)及其预训练和微调阶段的训练计划。
• 优化分布式数据加载和管道吞吐量,以支持大规模训练,确保在模型变种和模态组合之间的稳健性。
• 管理基础设施,以支持实验跟踪、模型版本控制和跨团队的部署工作流程,与生产和研究平台集成。
• 支持研究、产品和创意团队的后端工程,确保从原型设计到推理的数据和模型工作流程的无缝集成。