创始工程师：强化学习与策略化 - Atmanlabs招聘

职位：创始工程师：强化学习与智能策略化创始工程师：强化学习与智能策略化 Atman Labs, 伦敦关于Atman Labs 在Atman Labs，我们正在构建能够模拟积极主动的人类专业知识的软件。通过独立的人工智能技术，模拟真正的人类智能和与深入知识和积极协助的互动一直是不可能的。我们独特的研究涉及定制强化学习环境、大规模知识表示和知识呈现，受到生物先验知识的启发，并将与商业应用相结合不断发展和推广。作为一家应用研究和商业化公司，我们正在将我们的平台部署到多个商业领域的产品中，以展示我们方法的价值-从构建电子商务的积极购物礼宾服务开始，最终推出旅行、医疗保健、教育等产品。强化学习应用的下一个前沿：模拟人类专业知识和意识我们正在招聘一位创始工程师，负责推动强化学习在构建模仿人类专家智能和动态的积极代理人互动方面的最新技术。作为一名以第一原理、生物学思维为根基的强化学习专家，你能够发现生物系统具有无限的行动和回报序列，可以通过定制的强化学习环境来表示，无论是否存在完美信息。虽然我们可以通过简单定义的环境来模拟基本的人类互动，但你意识到并对事实感到兴奋，即最终行动空间将变得非常复杂、分层且涵盖许多未明确定义的子行动。你将解决前沿问题，将强化学习的回报与知识呈现和推荐模块相连接，从头开始构建复杂且分层的环境来模拟特定的专家行动，并允许代理人制定智能策略，确定驱动人类参与的行动序列，无论是在短期还是长期内。关于你我们正在寻找雄心勃勃、独立思考者，他们渴望做出贡献，并希望成为实现这一目标的团队的一部分。你应该具备以下所有特质：你拥有博士学位或等同的强化学习应用产业经验，了解该领域的限制和前沿。你在设计、测试和部署端到端强化学习解决方案方面具有丰富的经验，并能够帮助制定实验和生产部署的准则。你对各种基于策略或价值的强化学习方法非常熟悉，如近端策略优化（PPO）、深度Q网络（DQN）和/或蒙特卡洛方法，并能够有策略地尝试和选择各种方法以适应当前情况或预期行为。你在Python编程方面有7年以上的经验，并且具备使用ML工具包和OpenAI Gymnasium等强化学习环境的开发经验。你既是一名软件工程师，也是一名能够提出新颖研究思路的人，你的代码证明了这一点。你能够从第一原理出发进行推理，在没有现成解决方案的情况下，同时能够批判性地评估是否值得考虑现有思路。你善于表达自己的思想，能够以书面、面对面和小组的形式展示你的想法，并能够向各个层次的观众介绍强化学习的新颖应用和相关性。你能够轻松区分真实和高度诚信的思考者与“装模作样者”，同时能够批判性地评估自己工作中的真实性和虚构性。你的同事认为你是一个极其积极的人，你能够增强他人的能量而不是压抑情绪。当你对一个话题产生真正的兴趣时，你的热情会从0升至1000。你不仅对强化学习感兴趣，还对一系列跨学科的话题深感好奇，包括知识图谱、推荐系统、大规模搜索、深度学习、生成式AI模型、计算机视觉等，并有机会构建受生物学启发的真正智能的软件系统。你在个人追求中展现出高度的创造力和强烈的热情，你的智力、创造力和动力不仅局限于一个学科。你认为自己是一位创新者和独立思考者，而不是追随者。你正在寻找一种为世界做出贡献的方式，并希望加入我们的团队。你希望在伦敦亲自工作。别担心，我们会为你办理签证。我们很期待与你见面。如果你也是，请发送一条简短的消息，列出你的项目和亮点，以及你的人生故事的简短段落，发送至shravan。