VLA和LLM工程师(模型训练与数据验证)

纽约 7天前全职 网络
103.6万 - 172.7万 / 年
关于Mecka AI Mecka AI正在为机器人和具身AI构建数据基础设施层。 我们与领先的AI实验室和机器人公司合作,提供用于训练、评估和部署机器人系统的高质量、真实世界数据集。我们的工作直接位于研究、数据和现实世界执行之间——模型性能由数据质量决定。 职位 我们正在寻找一位VLA和LLM工程师,作为我们大型模型训练工作的主要引擎。你的角色有两个方面:首先,你将通过训练和微调LLM和VLA来拥有自动化标注系统,以大规模处理我们的数据。其次,你是最终的验证者——你必须通过训练高性能模型来证明Mecka的数据在现实任务中确实有效。 这不是一个理论研究职位。你将负责整个过程:从为新架构编写数学公式到调试生产代码。我们不会给你一个完成的系统来工作;你需要从头开始让模型工作,并满足紧迫的产品截止日期。 你将从事的工作 自动化标注与管道智能(主要关注) 管道训练:训练和微调大语言模型(LLM)和视觉-语言-动作(VLA)模型,以自动标注、分割和描述大量机器人数据集。 知识应用:利用你的机器学习专业知识来改进我们当前的处理管道。你将应用从训练失败中学到的知识来优化数据的摄取、清理和表示。 语义推理:开发系统,使LLM能够推理高层次任务目标,而VLA则将这些目标与低层次的感官和动作数据结合。 数据验证(证明产品) “证明”阶段:你负责证明Mecka的数据是世界上最好的。你将通过训练在模拟和物理环境中都能达到最先进性能的模型来实现这一目标。 全周期所有权:你负责整个过程。你将处理模型的设置、训练和调试。如果机器人表现不佳,你需要诊断是架构缺陷还是数据缺口。 性能基准测试:设计实验,准确展示Mecka的数据如何改善模型的泛化能力和故障模式恢复。 跨职能支持 协助所有团队:运用你对模型机制的深刻理解来协助所有工程和研究功能。 生产调试:编写、测试和调试生产级代码。你受到按时交付功能性产品的激励,而不仅仅是为论文生成指标。 你是谁 所需背景 教育:计算机科学、机器人学、机器学习、物理学、数学或相关定量领域的博士学位或基于研究的硕士学位。 证明的研究历史:在NeurIPS、ICRA、CVPR等会议上发表的强大记录(或重要的开源贡献),展示你在LLM或VLA框架内进行训练和创新的能力。 数学严谨性:你理解变压器、多模态嵌入和缩放定律的基本原理。你不仅仅是“调优”模型;你理解其背后的数学。 生产工程师:你是编写和调试生产级代码的专家。你受到按时交付功能性产品的激励,而不仅仅是发表论文。 全栈机器学习执行:你有从空白脚本到部署、工作系统(在模拟或硬件上)的经验。 强烈信号: 坚韧不拔:你能接受一个非功能性系统并完全负责直到它工作。 架构直觉:你能看着训练曲线并直观地理解需要哪些架构或数据层面的更改。 建设者心态:你以研究为驱动,但务实。你希望看到你的研究推动真实的机器人并解决现实世界的数据问题。 为什么选择这个职位 直接处理大规模的真实世界机器人数据 影响领先的机器人团队如何收集和使用数据 将你的VLA/LLM专业知识应用于比几乎任何学术实验室都更大、更丰富的真实世界数据集。 薪酬范围:$150K - $250K