职位编号:26-00173
在创新技术解决方案开始的地方运用您的技能。ECLARO正在为我们位于加利福尼亚州洛斯阿尔托斯的客户寻找一名数据工程师 - 自动驾驶汽车AI研究基础设施。
ECLARO的客户是一家领先的技术解决方案提供商,与客户合作管理他们的需求并实现业务目标的成功。如果您准备好迎接挑战,那么就抓住这个有回报的机会吧!
职位概述:
• 在公司,我们的使命是改善人类生活质量。
• 我们正在开发新工具和能力以增强人类体验。
• 为了引领这一移动性的变革,我们在能源与材料、人本AI、人机交互驾驶、大型行为模型和机器人领域组建了一支世界级的团队。
• 在人机交互驾驶部门,极限性能智能控制部门正在通过向专家人类驾驶员学习来开发可扩展的、类人驾驶智能。
• 该项目专注于创建一个可配置的数据驱动世界模型,作为动态驾驶环境中智能多代理推理的基础。
• 通过紧密整合感知、世界建模和基于模型的强化学习的进展,我们旨在克服更为分隔的、基于规则的方法的局限性。
• 最终目标是实现稳健、适应性强且可解释的驾驶策略,这些策略可以在任务、传感器模式和公共道路场景中进行泛化——为ADAS、自动驾驶系统和基于仿真的软件开发带来变革性改进。
• 作为数据工程师,您将是这一使命的关键推动者——负责收集、组织、清理和传递为我们的世界模型、感知系统和强化学习算法提供动力的传感器和仿真数据。
• 将与研究科学家和机器学习工程师密切合作,确保我们的管道可靠、可扩展且高效——推动智能驾驶在仿真和现实世界部署中的突破。
职责:
• 设计、实施和维护稳健的数据管道,用于摄取、清理和转换大规模自动驾驶汽车数据集(摄像头、LiDAR、雷达、GPS、仿真日志)。
• 使用AWS服务(S3、EC2、SageMaker、Athena等)开发可扩展的存储和检索系统。
• 通过自动验证、去重和模式强制确保数据质量和一致性。
• 与ML研究人员和工程师合作,提供高效的训练数据、标签和元数据访问。
• 优化数据预处理和批处理管道,以支持大规模训练和评估工作流。
• 构建工具以管理和审计数据集版本、实验跟踪和特征可重复性。
• 实施和维护数据和管道更新的CI/CD工作流,确保最小停机时间和可重复输出。
• 监控数据管道性能并主动响应瓶颈或中断。
资格:
• 计算机科学、数据工程或相关领域的学士或硕士学位。
• 3年以上构建生产级数据基础设施或ML数据管道的经验。
• 精通Python和SQL,并具有数据工作流编排工具(例如,Airflow、Prefect、Luigi)的经验。
• 深入了解AWS服务,尤其是S3(数据存储)、EC2(计算)和SageMaker(模型训练)。
• 熟悉分布式计算框架,如Spark、Dask或Ray。
• 理解研究中数据集文档化、标准化和可重复性的最佳实践。
• 具有自动驾驶汽车数据集或机器人传感器数据的经验。
• 熟悉ML训练管道和模型评估工作流。
• 具有与高吞吐量环境中的研究人员或应用ML团队合作的经验。
如果被录用,您将享受以下ECLARO福利:
• 由Merrill Lynch管理的401k退休储蓄计划
• 通勤支票税前通勤福利
• 有资格通过ECLARO购买医疗、牙科和视力保险
如果感兴趣,您可以联系:
Jeanine Hastings
jeanine.hastings@eclaro.com
646-755-9303
Jeanine Hastings | LinkedIn
平等机会雇主:ECLARO重视多样性,并且在遵守所有适用法律的情况下,不会基于种族、肤色、宗教、性别、性取向、国籍、年龄、遗传信息、残疾、受保护的退伍军人身份或任何其他法律保护的群体身份进行歧视。