要求:
• 正在攻读STEM学位,
• 熟练掌握Python(具有PyTorch/Tensorflow或HPC集群经验者优先),
• 接触过用于工程大规模数据流水线和模型训练的工具(例如HPC集群或MapReduce),
• 拥有1或2个个人机器学习或软件工程项目的作品集,这些项目是在课程之外进行的。
工作内容:
• 我们可以为您提供在编写生产级机器学习流水线和使用Pytorch训练神经网络方面的经验,同时为您的简历增添学术成就(我们过去曾在NeurIPS上发表过论文),
• 我们的主要研究方向是大规模自监督学习,但我们对机器学习的所有领域都感兴趣;从贝叶斯推理和强化学习到大规模数据处理和分析,
• 开发新产品,例如语言识别,从训练模型到将其投入生产使用,
• 发现数据中提升我们在具有挑战性的音频上的世界领先准确性的领域,
• 编写数据预处理流水线,以在数千个核心上处理数万亿个单词,
• 在云端的数百个GPU上扩展自监督学习模型,
• 在近期论文中举办学术讨论会或撰写博客文章,
• 与研究机构建立联系,研究AI中的偏见。