机器学习研究工程师 - Astera Institute招聘

奥贝利斯克（Obelisk）是一个人工智能实验室，借鉴神经科学的见解来开发人工通用智能（AGI），该智能可以学习、适应变化环境、使用工具并进行推理，而不会破坏人类关心的事物。其他人也在朝着类似的目标努力，但大部分工作都集中在LLMs或类似方向上。我们正在构建具有以下核心能力的系统，而当前的系统尚缺乏这些能力：持续适应变化的环境。将奖励与导致这些奖励的正确行为集关联起来，即使在非常长的时间尺度上也是如此。长期和分层规划。我们正在使用强化学习等技术来开发具备这些能力的智能体。我们正在寻找一位机器学习研究工程师，负责实现架构、开发环境、训练模型、总结结果并协助指导研究方向。关键要求 •扎实的编程技能 •使用PyTorch或Jax训练强化学习模型的经验，能够在新数据集或环境上进行训练 •熟悉机器学习理论你将会 •与工程师和研究人员合作，运行强化学习实验以评估研究思路 •训练最先进的模型作为我们研究的性能基线 •帮助设计架构、训练算法以及训练和测试任务 •为我们高素质工程团队的技术和文化基础做出贡献你是 •严谨的实验者：你会确保实验可复现，并记录你所做的工作 •严谨的软件工程师：你会使用所有可用的工具，包括静态分析和单元测试，编写无错的代码 •清晰的沟通者，具备领导技术讨论的能力 •热衷于在初创环境中的小型成长团队工作，并对结果产生直接影响的工作充满热情