高级机器学习工程师 – 大型语言模型/强化学习 - 化学与药物发现

蒙特利尔 20小时前全职 网络
面议
地点:蒙特利尔 职位编号:J 职位类型:全职 职位类别:信息技术 薪资:面议 高级机器学习工程师 – LLM/RL - 化学与药物发现 这是一家在药物发现领域领先的人工智能公司,已推出多款软件产品,包括目标识别平台和自动化药物发现平台。我们正在寻找一位机器学习工程师加入团队。您将与产品团队以及该领域的顶级AI科学家合作。公司专注于AI辅助系统,能够识别未治疗疾病的新药物靶点,协助开发新疗法,并最终预测这些疗法在临床试验中的表现。 根据NVIDIA的评估,该公司在社会影响潜力方面排名前五,并被CB Insights评为全球前100名AI公司之一。他们希望在阿布扎比或上海的办公室增加一名团队成员。公司提供全面的搬迁支持。 关于职位的更多信息: 公司正在寻找一位高级机器学习工程师(LLM/RL),以构建和扩展用于分子任务的GenAI模型。您将致力于一个全面的小分子药物发现平台。 招聘经理强调,此人应具有丰富的强化学习经验,并擅长在多GPU环境中训练模型。熟悉RL库者优先。 扩散模型的经验也是相关的,但优先级较低。 工作地点 • [办公室地址 - 阿布扎比] • [办公室地址 - 上海] • 向ML团队负责人汇报 • 搬迁的详细信息如下所述。 职责 • 设计和扩展LLM的强化学习微调工作流程,包括RLVR/RLHF方法。 • 构建和优化跨多GPU和多节点环境的高吞吐量变压器训练管道。 • 将模型适应于特定领域的药物发现和分子设计任务,如分子生成和属性预测。 • 领导实验设计,监控核心指标,并通过演示和/或出版物传达见解和发现。 教育背景 计算机科学、机器学习、计算化学或相关定量学科的硕士、博士或同等相关经验。 所需技能和经验 • 机器学习工程: 至少五年机器学习工程经验 • 变压器: 精通使用PyTorch训练和部署大型变压器模型 • 强化学习算法: 具有PPO/DPO/RLOO/GRPO及其他相关策略梯度和基于偏好的优化方法的实际经验 • 可扩展的训练管道: 精通数据、模型、上下文和管道并行化 • 奖励整合: 开发多样化的奖励函数和模型的经验 • 工具和协作: 优秀的Python技能,熟悉Hugging Face Transformers、TRL/RLlib/Verl、Deep Speed、vLLM、Docker、Sagemaker和CI/CD工作流程 理想技能 • 高级职位:至少两年高级职位经验 • 药物发现与分子设计: 具有化学、化学信息学、结构生物学背景或分子生成模型经验 • 生成模型: 了解扩散、基于流和其他生成模型 • 研究领导力: 拥有机器学习出版物的记录 阿布扎比的搬迁详情 • 阿联酋0%所得税 • 每年可在全球任何地方远程工作1个月 • 公司提供6个月的住房,随后2年的住房津贴(覆盖大部分费用) • 适合家庭(配偶+2个孩子)的住房 • 学校支持:1个孩子100%,另一个75%(为期2年) • 覆盖搬迁和旅行的机票费用 • 搬迁费用的谈判包 • 税后年薪约10万美元;对于经验丰富的候选人,薪资灵活 您的招聘伙伴 您对这份工作感兴趣吗?