奥贝利斯克(Obelisk)是一个人工智能实验室,借鉴神经科学的见解来开发人工通用智能(AGI),该智能可以学习、适应变化环境、使用工具并进行推理,而不会破坏人类关心的事物。
其他人也在朝着类似的目标努力,但大部分工作都集中在LLMs或类似方向上。我们正在构建具有以下核心能力的系统,而当前的系统尚缺乏这些能力:
持续适应变化的环境。
将奖励与导致这些奖励的正确行为集关联起来,即使在非常长的时间尺度上也是如此。
长期和分层规划。
我们正在使用强化学习等技术来开发具备这些能力的智能体。
我们正在寻找一位机器学习研究工程师,负责实现架构、开发环境、训练模型、总结结果并协助指导研究方向。
关键要求
•扎实的编程技能
•使用PyTorch或Jax训练强化学习模型的经验,能够在新数据集或环境上进行训练
•熟悉机器学习理论
你将会
•与工程师和研究人员合作,运行强化学习实验以评估研究思路
•训练最先进的模型作为我们研究的性能基线
•帮助设计架构、训练算法以及训练和测试任务
•为我们高素质工程团队的技术和文化基础做出贡献
你是
•严谨的实验者:你会确保实验可复现,并记录你所做的工作
•严谨的软件工程师:你会使用所有可用的工具,包括静态分析和单元测试,编写无错的代码
•清晰的沟通者,具备领导技术讨论的能力
•热衷于在初创环境中的小型成长团队工作,并对结果产生直接影响的工作充满热情