应用人工智能研究员 - 视频扩散
地点:现场,旧金山,加州
薪资:$160,000 - $300,000 + 股权(0.5%-2%)
就业类型:全职
关于该职位
一家位于旧金山的早期人工智能初创公司正在构建下一代人类运动和表情的视频基础模型。他们正在寻找一位应用人工智能研究员,帮助从头开始领导最先进的视频扩散模型的训练,直接处理大量视觉数据集和数百个GPU。
这是一个高责任感的角色,所在公司培训自己的模型(不仅仅是微调其他模型),并得到了知名投资者和来自顶级人工智能、视频和基础设施公司的创始人的支持。
您将要做的事情
• 训练大规模扩散和基于变压器的视频生成模型
• 策划、清理和标记互联网规模的视频数据集
• 进行有针对性的实验,并快速迭代模型改进
• 提炼模型以实现更快的推理,且性能损失最小
• 关注arXiv和GenAI研究;帮助塑造模型路线图
• 构建LoRA模块以扩展模型能力
要求
• 2年以上在Python和PyTorch中从零开始构建机器学习模型的经验
• 深厚的视觉变压器、扩散模型或相关架构的经验
• 熟悉在GPU工作负载的Linux集群上工作
• 具备标记工具的经验(例如,面部检测、说话人识别)
• 强大的研究思维方式 - 博士学位或顶级出版物者优先
• 熟悉视频压缩、编解码器和感知指标
如果您符合以下条件...
• 您在训练生成视频模型方面动手能力强
• 您在早期阶段的环境中茁壮成长,并希望在研究到部署的全过程中产生影响
• 您对干净的数据和新颖的架构设计充满热情
• 您活跃于人工智能研究圈,并跟踪最新的GenAI趋势