高级人工智能工程师 - 多模态模型的数据与基础设施 (100% 远程)

迪拜 无个税12天前全职 网络
57.8万 - 86.7万 / 年
关于职位 我们正在寻找经验丰富的人工智能基础设施工程师,设计并实现强大且可扩展的管道,以处理大规模数据工作负载。加入 Tether 的应用研究团队,您将为跨越数千个 GPU 的高影响力项目做出贡献,推动前沿视频生成基础开发。 职责: • 构建并扩展高吞吐量数据基础设施,优化视频和多模态内容处理,适用于大型 GPU 集群(例如 H100/H200)。 • 设计视频、音频、文本和图像模态的核心预处理算法,实现时间数据的高效提取、同步和标准化。 • 构建自动化获取管道,以源源不断地获取大规模视频数据集,处理不同格式、帧速率、注释和嵌入音频。 • 架构强大的系统,以支持可扩展的评估和注释,包括基于提示的评分、感知指标、字幕生成和基于检索的诊断。 • 与模型研究人员合作,共同设计视频模型架构(例如 DiTs、VAEs、时空变换器)及其预训练和微调阶段的训练计划。 • 优化分布式数据加载和管道吞吐量,以支持大规模训练,确保在模型变种和模态组合之间的稳健性。 • 管理基础设施,以支持实验跟踪、模型版本控制和跨团队的部署工作流程,与生产和研究平台集成。 • 支持研究、产品和创意团队的后端工程,确保从原型设计到推理的数据和模型工作流程的无缝集成。