经理,首席研究科学家,大语言模型代理(基础研究)

多伦多 29天前全职 网络
71.9万 - 89.9万 / 年
此职位发布是为了主动招聘目的,可能用于填补我们组织内的当前职位空缺或未来的空缺。 您是否是一个好奇和开放思维的人,对进行最先进的基础机器学习研究感兴趣?汤森路透实验室正在寻找热衷于在数据丰富、复杂的学术环境中构建基于代理的复杂AI系统的研究科学家,以解决现实世界的问题。 基础研究是汤森路透的专门核心机器学习研究部门。我们专注于研究和开发,特别关注大型语言模型(LLMs)的高级算法和训练技术。我们正在不同领域建立强大的研究能力基础,并寻找能够激励和指导其团队的管理者,他们愿意亲自动手参与设计、编码、进行实验,并将研究结果转化为具体的交付成果。我们的重点领域包括: • LLM培训(持续预训练、指令调优、强化学习对齐、分布式训练、高效ML技术) • 计划、推理和复杂工作流程的后训练技术(例如,推理模型,LLMs + 知识图谱,测试时计算,CoT管道,工具使用和API调用等) • 数据中心的机器学习(合成数据、课程学习、学习的数据混合等) • 评估(基准测试、人机互动、红队测试/对抗性测试、幻觉检测等) 我们与TR实验室(TR的应用研究部门)、世界领先研究机构的学术合作伙伴以及拥有数十年经验的主题专家合作。我们通过实验、原型设计、测试和交付想法,追求更智能、更有价值的模型,这些模型是在前所未有的数据财富和最先进的技术基础设施的支持下训练的。通过我们独特的机构经验,我们可以接触到参与数据收集、测试和评估训练模型的前所未有数量的主题专家。 作为研究科学家经理,您将在领导一个多元化的全球专家团队中发挥关键作用。我们聘请世界领先的ML/NLP/GenAI专家以及工程师,推动公司内部AI模型开发的领先地位。您将有机会发表您的研究成果,并为我们的专有AI模型研究与开发做出贡献。汤森路透实验室以在追求学术卓越和支持为汤森路透客户提供新颖而令人兴奋的高增长产品的过程中,一贯交付成功的数据驱动ML解决方案而闻名。 关于角色 在这个机会中,作为研究科学家经理,您将: • 领导:您将参与基础研究的战略规划、招聘和管理。这为您提供了掌握管理技能、指导、领导和帮助下属成长并为更广泛的团队做出贡献的机会。 • 创新:您将在AI研究的最前沿创新和创造新的最先进的代理AI/LLM代理方法。您将贡献想法,并在代理环境中使用丰富的数据解决现实世界的挑战。 • 实验和开发:您将参与整个研究和模型开发生命周期,包括头脑风暴、编码、测试,并在国际领先的学术会议上提交高质量的报告。 • 合作:在汤森路透内部和我们世界领先大学的学术合作伙伴中,您将与全球研究工程师团队合作。 • 沟通:通过研讨会、讲座、会议的贡献和/或分享出版物和/或技术资产(数据和模型),积极参与与更广泛的社区分享我们的技术发现。 关于您 如果您的背景包括以下内容,您将适合这个角色: 必需资格: • 相关学科的博士学位。 • 在学术界(例如,通过学生监督)或行业中领导团队构建高级ML/NLP/AI系统的3年以上实际经验。 • 在顶级会议(例如,NeurIPS、ICML、ICLR、ACL、EMNLP、NAACL、ICLR)中具有强大的发表记录,特别关注代理系统、工具使用或多代理协调。 • 熟悉一个或多个深度学习框架(例如,pytorch、jax、tensorflow等) • 在完成博士学位之外的ML研究经验(例如,监督、行业经验、领导学术计划等)。 • 优秀的沟通技巧,能够清晰地口头和书面报告和展示研究成果和发展。 • 好奇和创新的性格,能够设计出新颖、合理的算法解决方案来解决相关问题。 • 良好的人际交往能力,能够激励、启发和指导团队成员。 • 能够在快节奏、敏捷的环境中工作,管理不确定性和模糊性。 优先资格: • 在顶级会议或研究社区中具有高影响力的出版物或其他影响力。 • 在学术界(例如,通过学生监督)或商业应用中领导团队构建高级ML/NLP/IR系统的5年以上实际经验。 • 在深度学习和大规模模型训练方面有丰富经验。 • 在LLM环境中从事基于代理的系统、工具使用AI或多代理协调方面有丰富经验(例如,初创公司、行业或丰富的开源经验)。 • 强大的软件和/或基础设施工程技能,确保软件交付管理良好,如通过对流行开源库的代码贡献或编写生产代码。 • 使用Amazon AWS、MS Azure或Google Cloud等云工具在分布式节点上训练大规模模型的经验。 您将享受: • 学习和发展:在职指导和学习,以及使用尖端方法和技术的机会。 • 大量数据、计算和高影响力问题:我们的科学家和工程师可以探索大型数据集并发现新的能力和见解。汤森路透以全球知名的路透社新闻机构而闻名,但我们的公司也是法律、企业、税务和会计专业人士的信息领先来源。我们拥有超过60,000 TB的法律、监管、新闻和税务数据。我们还为我们的研究人员和工程师提供所有主要云计算平台的访问权限。 • 具有竞争力的薪酬和福利套餐:在学习新技能的同时获得收入的机会。 #LI-AB1 对您有什么好处? • 混合工作模式:我们为办公室角色采用了灵活的混合工作环境(每周2-3天在办公室,具体取决于角色),同时提供无缝的数字和物理连接体验。 • 灵活性和工作生活平衡:Flex My Way是一套支持性的工作场所政策,旨在帮助管理个人和职业责任,无论是照顾家庭、回馈社区,还是找到时间刷新和重置。这建立在我们的灵活工作安排之上,包括每年最多8周的任何地方工作,赋予员工实现更好的工作生活平衡的能力。 • 职业发展和成长:通过培养持续学习和技能发展的文化,我们为人才准备迎接明天的挑战并提供现实世界的解决方案。我们的Grow My Way计划和以技能为先的方法确保您拥有在AI驱动的未来中成长、领导和茁壮成长的工具和知识。 • 行业内具有竞争力的福利:我们提供全面的福利计划,包括灵活的假期、两天公司范围的心理健康假、Headspace应用程序的访问、退休储蓄、学费报销、员工激励计划以及心理、身体和财务健康的资源。 • 文化:全球公认的、获奖的包容和归属感、灵活性、工作生活平衡等声誉。我们以我们的价值观为生:关注我们的客户、竞争取胜、挑战(您的)思维、快速行动/快速学习、团结更强。 • 社会影响:通过我们的社会影响研究所在您的社区中产生影响。我们为员工每年提供两天带薪志愿者假期,并提供参与公益咨询项目和环境、社会和治理(ESG)计划的机会。 • 产生现实世界的影响:我们是全球少数几家帮助客户追求正义、真相和透明度的公司之一。与我们服务的专业人士和机构一起,我们帮助维护法治、推动商业运转、抓捕不法分子、报道事实,并向全球人民提供可信赖的、无偏见的信息。 我们在招聘过程中使用AI 汤森路透利用人工智能(AI)支持我们全球招聘过程的部分环节。除非您选择退出,否则我们的AI系统将评估您提供的信息,并将其与职位要求进行比较,并将结果呈现给我们的招聘人员以供进一步审核。AI系统作为辅助工具,但始终由人类决定您是否会被考虑担任该职位。 汤森路透遵守要求提前披露职位预期薪酬范围的当地法律。基本薪酬范围因地点而异。 在加拿大安大略省,该职位的基本薪酬范围为140,000加元至175,000加元。 基本薪酬在范围内定位基于多种因素,包括个人的知识、技能和经验,并考虑到内部公平。基本薪酬是全面总奖励计划的一部分,该计划还包括灵活和支持性的福利以及其他健康计划。该角色也可能有资格获得基于企业和个人绩效组合的年度奖金。 关于我们 汤森路透通过汇集人们和组织做出正确决策所需的可信内容和技术来指明前进方向。我们为法律、税务、会计、合规、政府和媒体领域的专业人士服务。我们的产品结合了高度专业化的软件和见解,赋予专业人士以数据、智能和解决方案,帮助机构追求正义、真相和透明度。汤森路透旗下的路透社是全球领先的可信新闻和新闻提供者。 我们拥有来自70多个国家的26,000名员工的才华支持,在灵活的工作环境中,每个人都有机会贡献和专业成长。在客观性、准确性、公正性和透明度受到攻击的时代,我们认为追求这些是我们的责任。听起来令人兴奋吗?加入我们,帮助塑造推动社会前进的行业。 作为一家全球性企业,我们依靠所有员工的独特背景、观点和经验来实现我们的业务目标。为确保我们能够做到这一点,我们在全球所有运营中寻找有才华、合格的员工,无论种族、肤色、性别/性别(包括怀孕、性别认同和表达)、国籍、宗教、性取向、残疾、年龄、婚姻状况、公民身份、退伍军人身份或任何其他受适用法律保护的分类。汤森路透自豪地成为一个提供无毒工作环境的平等就业机会雇主。 我们还根据适用法律为合格的残疾人和真诚持有的宗教信仰提供合理的便利。有关请求便利的更多信息,请点击这里。 了解更多关于如何保护自己免受虚假职位发布的信息,请点击这里。 有关汤森路透的更多信息,请访问thomsonreuters.com。