我们是谁?
我们的使命是扩大智能以服务人类。我们正在为开发者和企业培训和部署前沿模型,以构建能够提供神奇体验的AI系统,如内容生成、语义搜索、RAG和代理。我们相信,我们的工作对于AI的广泛应用至关重要。
我们对所构建的内容充满热情。我们每个人都负责提升模型的能力以及为客户创造的价值。我们喜欢努力工作,快速行动,以做出对客户最有利的决策。
Cohere是一个由研究人员、工程师、设计师等组成的团队,他们对自己的工作充满热情。每个人在各自的领域都是世界上最优秀的。我们相信,多样化的观点是构建伟大产品的必要条件。
加入我们的使命,塑造未来!
集成团队负责开发和扩展用于LLM后期训练的机器学习算法和基础设施,重点关注大规模、分布式的RL方法。我们通过精心设计实验和设计文档,追求工程和科学的卓越。虽然任务是根据每个人的专业分配的,但根据个人的兴趣和组织的需求,团队会共同努力编写生产代码并支持团队的研究工作。
具体而言,这个角色旨在通过实施新工具来改善后期训练代码库的整体质量,以简化和支持研究,优化后期训练算法,并将分布式RL扩展到前所未有的水平。
请注意:我们在伦敦、巴黎、多伦多、旧金山和纽约设有办公室,但我们也支持远程工作!此职位的申请者可以在UTC−06:00到UTC+01:00之间的任何地方工作。
作为技术人员成员,您将:
• 设计并编写高性能和可扩展的软件以训练模型。
• 开发新工具以支持和加速研究和LLM训练。
• 与其他工程团队(基础设施、效率、服务)和科学团队(代理、多模态、多语言等)协调,以创建强大且集成的后期训练生态系统。
• 制定并实施技术以提高性能,加快我们的训练周期,包括SFT、离线偏好和RL机制。
• 在我们的集群和数据基础设施上研究、实施和实验想法。
• 与其他科学家、工程师和团队协作、协作、再协作!
如果您是理想候选人,您将:
• 拥有极强的软件工程技能。
• 重视测试驱动开发方法、干净的代码,并努力在各个层面减少技术债务。
• 精通Python及相关的机器学习框架,如JAX、Pytorch和/或XLA/MLIR。
• 具备使用和调试大规模分布式训练策略的经验(内存/速度分析)。
• [加分项] 具备分布式训练基础设施(Kubernetes)及相关框架(Ray)的经验。
• [加分项] 在模型训练的后期阶段拥有实践经验,重点关注可扩展性和性能。
• [加分项] 在机器学习、LLM和RL学术研究方面的经验。
如果您:
• 对高质量的工作充满热情。
• 喜欢调整和优化大型LLM模型。
• 能够与不同软件工程技能水平的人合作,从初学者到高级人员。
• 能够深入复杂的机器学习代码库,识别和解决问题,确保我们的系统平稳运行。
• 在快节奏、技术挑战的环境中茁壮成长,能够贡献您的创新想法和解决方案。
如果以上某些要求与您的经验不完全匹配,我们仍然鼓励您申请!
我们重视并庆祝多样性,努力为所有人创造包容的工作环境。我们欢迎来自各个背景的申请者,并致力于提供平等的机会。如果您在招聘过程中需要任何便利,请提交便利请求表格,我们将共同努力满足您的需求。
Cohere的全职员工享受以下福利:
🤝 开放和包容的文化和工作环境
🧑💻 与处于AI研究前沿的团队紧密合作
🍽 每周午餐津贴,办公室午餐和零食
🦷 完整的健康和牙科福利,包括单独的预算来照顾您的心理健康
🐣 100%育儿假补贴,最长可达6个月
🎨 个人充实福利,涵盖艺术和文化、健身与健康、优质时光和工作空间改善
🏙 远程灵活,设有多伦多、纽约、旧金山、伦敦和巴黎的办公室,以及共享办公津贴
✈️ 6周假期(30个工作日!)