研究工程师(数据基础设施/机器学习)

旧金山 1个月前全职 网络
142.3万 - 213.4万 / 年
研究工程师(数据基础设施/机器学习) 湾区(混合办公) 你能否使用 Ray 或 Spark 构建和优化分布式机器学习管道? 你是否喜欢加速云基础设施(Kubernetes、Docker、CI/CD)? 你是否对构建大规模机器学习训练的数据基础设施感到兴奋? 我们是一家获得顶级风险投资支持的初创公司,正在利用人工智能开发超真实的 3D 模拟。我们的客户包括自动驾驶汽车、无人机和机器人等行业的领先企业。 角色 你将亲自改善 CI/CD 管道,加速 Docker 构建,并在 Ray 上扩展场景处理。你还将: • 为多模态数据集(3D、视频、传感器)构建高性能数据管道。 • 优化 Spark、Databricks 和 Kubernetes 上的分布式训练和处理。 • 与研究人员合作,将 PyTorch 模型投入生产并简化机器学习工作流。 • 开发工具,使数据在机器学习生命周期中可发现、可重用和可靠。 你 • 具备扎实的 Python 技能和分布式系统(Ray、Spark、Flyte、Dask)经验。 • 熟悉云、Kubernetes 和分布式训练(Ray、PyTorch DDP、Horovod)。 • 熟悉数据集版本控制和实验跟踪(DVC、MLflow)。 额外加分 • 在仿真、机器人或自主管道方面的经验。 • 深度学习(PyTorch)和 3D / 传感器数据(LIDAR、网格、辐射场)的背景。 • 开源贡献或前端/UI 经验。