关于Mecka AI
Mecka AI正在为机器人和具身AI构建数据基础设施层。
我们与领先的AI实验室和机器人公司合作,提供用于训练、评估和部署机器人系统的高质量、真实世界数据集。我们的工作直接位于研究、数据和现实世界执行之间——模型性能由数据质量决定。
职位介绍
我们正在寻找一名VLA和LLM工程师,作为我们大型模型训练工作的主要引擎。你的角色有两个方面:首先,你将通过训练和微调LLM和VLA来拥有自动化标注系统,以大规模处理我们的数据。其次,你是终极验证者——你必须通过训练高性能模型来证明Mecka的数据在现实任务中表现优异。
这不是一个理论研究职位。你将负责整个过程:从为新架构编写数学公式到调试生产代码。我们不会给你一个完成的系统来工作;你需要从一开始就负责让模型工作并满足紧迫的产品截止日期。
你的工作内容
自动标注与管道智能(主要关注)
- 管道训练:训练和微调大型语言模型(LLM)和视觉-语言-动作(VLA)模型,以自动标注、分割和描述大规模机器人数据集。
- 知识应用:利用你的机器学习专业知识改进我们当前的处理管道。你将应用从训练失败中学到的知识来完善数据的摄取、清理和表示方式。
- 语义推理:开发系统,使LLM能够推理高层次任务目标,而VLA则将这些目标落实到低层次的感官和动作数据中。
数据验证(证明产品)
- “证明”阶段:你负责证明Mecka的数据是世界上最好的。你将通过训练在模拟和物理环境中都能达到最先进性能的模型来实现这一点。
- 全周期所有权:你负责整个过程。你将处理模型的设置、训练和调试。如果机器人表现不佳,你需要诊断是架构缺陷还是数据缺口。
- 性能基准测试:设计实验以准确展示Mecka的数据如何改善模型的泛化和故障模式恢复。
跨职能支持
- 支持所有团队:运用你对模型机制的深刻理解来支持所有工程和研究职能。
- 生产调试:编写、测试和调试生产级代码。你的动力来自于在截止日期前交付一个功能产品,而不仅仅是为论文生成指标。
你的背景
必需背景
- 教育:计算机科学、机器人、机器学习、物理、数学或相关定量领域的博士学位或基于研究的硕士学位。
- 证明的研究历史:在NeurIPS、ICRA、CVPR等会议上发表的强大记录或重要的开源贡献,展示你在LLM或VLA框架内进行训练和创新的能力。
- 数学严谨性:你理解变压器、多模态嵌入和缩放定律的基本原理。你不仅仅是“调优”模型;你理解底层数学。
- 生产工程师:你是编写和调试生产级代码的专家。你的动力来自于按时交付一个功能产品,而不仅仅是发表论文。
- 全栈ML执行:你有从空白脚本到部署、工作系统(在模拟或硬件上)的经验。
强烈信号:
- 韧性:你能接受一个非功能性系统并完全负责直到它工作。
- 架构直觉:你能看一眼训练曲线并直观地理解需要哪些架构或数据层面的更改。
- 建设者心态:你以研究为驱动但务实。你希望看到你的研究推动真实机器人并解决现实世界的数据问题。
为什么选择这个职位
- 直接处理大规模的真实世界机器人数据
- 影响领先的机器人团队如何收集和使用数据
- 将你的VLA/LLM专业知识应用于几乎任何学术实验室都无法比拟的更大更丰富的真实世界数据集。
薪酬范围:$150K - $250K