职位编号：R0232812 强化学习AI工程师机会： Booz Allen Hamilton正在寻找一位创新且经验丰富的AI开发人员，专注于强化学习，加入我们不断发展的太空解决方案团队。在这个角色中，您将利用您在人工智能、数据科学和机器学习工程方面的专业知识来训练、测试、部署和维护从数据中学习的模型。成功的候选人将与跨职能团队合作，将强化学习研究转化为操作能力和生产级代码，带来显著的技术进步，推动任务成功。您将在公司内的一个大型机器学习工程师社区中成长，并与一支专注于太空行业和AI的专业团队合作，提供世界级的解决方案，以近实时解决导弹防御问题。您将从事的工作： - 设计、实现和训练用于复杂决策问题的强化学习（RL）和多智能体强化学习（MARL）算法。 - 使用Python和现代ML框架开发可扩展的训练管道。 - 在模拟环境中使用Gym或Gymnasium、高保真模拟器或自定义环境构建和评估代理。 - 应用RL技术，如策略优化、基于价值的学习、基于模型的RL和模仿学习。 - 与领域专家合作，定义与任务目标一致的奖励结构、约束和评估指标。 - 实施利用云计算、容器化和编排技术的分布式训练工作流。 - 将训练好的模型转移到生产系统中，遵循强大的软件工程最佳实践。 - 贡献于Python的系统架构和性能优化，并有机会扩展到C++或Rust以实现高性能组件。加入我们。世界不能等待。您具备的条件： - 开发和训练强化学习代理的经验 - 人工智能、数据科学、机器学习工程或软件工程经验 - 使用Python、C++或Rust开发技术解决方案的经验 - 机器学习知识，包括强化学习 - 能够获得秘密许可 - 计划在2026年春季或夏季获得学士学位如果您具备以下条件会更好： - 将RL应用于自主性、控制系统或任务规模的经验 - 多智能体强化学习（MARL）经验 - Gym或Gymnasium环境经验 - AFSIM或其他高保真模拟环境经验 - 在C、C++或Rust中嵌入式系统编程经验 - GPU编程经验，包括CUDA或RAPID - 使用ML框架的经验，如PyTorch、TensorFlow或JAX - 开发太空解决方案的经验 - 现代软件设计模式知识，包括微服务设计和Kubernetes部署中的编排 - 计算机科学、人工智能或工程领域的学士学位安全许可：被选中的申请人将接受安全调查，并可能需要满足访问机密信息的资格要求。薪酬在Booz Allen，我们庆祝您的贡献，为您提供机会和选择，并支持您的全面福祉。我们的福利包括健康、生命、残疾、财务和退休福利，以及带薪休假、专业发展、学费援助、工作生活计划和受抚养人护理。我们的表彰奖励计划表彰员工的卓越表现和对我们价值观的优异展示。每周至少工作20小时的全职和兼职员工有资格参加Booz Allen的福利计划。不符合门槛的个人仅有资格享受部分福利，不包括健康福利。我们鼓励您通过访问我们职业网站上的资源页面并查看我们的员工福利页面来了解更多关于我们全面福利的信息。 Booz Allen的薪资由多种因素决定，包括但不限于地点、个人的教育、知识、技能、能力和经验的特定组合，以及合同特定的可负担性和组织要求。该职位的预计薪酬范围为55,200.00美元至126,000.00美元（年化美元）。显示的估计值代表该职位的典型薪资范围，仅是Booz Allen员工总薪酬包的一部分。此职位将在发布日期后90天内关闭。身份声明作为申请过程的一部分，您需要在面试和评估期间开启摄像头。我们保留拍摄您的照片以验证您的身份和防止欺诈的权利。工作模式我们以人为本的文化优先考虑灵活性和协作的好处，无论是在现场还是远程进行。 - 如果该职位被列为远程或混合，您将定期在Booz Allen或客户站点设施工作。 - 如果该职位被列为现场，您将根据具体角色的需要与同事和客户进行面对面工作。承诺不歧视所有符合条件的申请人将获得就业考虑，不论其残疾、受保护的退伍军人身份或任何其他受适用联邦、州、地方或国际法律保护的身份。

强化学习人工智能工程师

Booz Allen Hamilton