此职位发布是为了主动招聘，可能用于填补我们组织内的当前职位空缺或未来的职位空缺。职位描述您是否是一个好奇且开放思维的人，对进行最先进的基础机器学习研究感兴趣？汤森路透实验室正在寻找热衷于在数据丰富、复杂的学术环境中构建复杂的基于代理的人工智能系统的研究科学家，以解决现实世界的问题。基础研究是汤森路透的专门核心机器学习研究部门。我们专注于研究和开发，特别关注大型语言模型（LLMs）的高级算法和训练技术。我们正在不同领域建立强大的研究能力基础，并寻找参与设计、编码、进行实验、将研究成果转化为具体交付成果并与学术界互动的科学家。我们的重点领域包括： • LLM训练（持续预训练、指令微调、强化学习对齐、分布式训练、高效机器学习技术） • 计划、推理和复杂工作流程的后训练技术（例如，推理模型、LLMs + 知识图谱、测试时计算、CoT管道、工具使用和API调用等） • 数据中心的机器学习（合成数据、课程学习、学习的数据混合等） • 评估（基准测试、人机协作、红队测试/对抗性测试、幻觉检测等）我们与TR实验室（TR的应用研究部门）、世界领先研究机构的学术合作伙伴和具有数十年经验的主题专家合作。我们通过实验、原型设计、测试和交付想法，追求在前所未有的数据财富和最先进的技术基础设施支持下训练的更智能和更有价值的模型。通过我们独特的机构经验，我们可以接触到大量参与数据收集、测试和评估训练模型的主题专家。作为研究科学家，您将在一个多元化的全球专家团队中发挥关键作用。我们聘请了机器学习/自然语言处理/生成式AI以及工程领域的世界领先专家，以推动公司内部领先的AI模型开发。您将有机会发表您的研究成果，并为我们的专有AI模型研究与开发做出贡献。汤森路透实验室以持续交付成功的数据驱动机器学习解决方案而闻名，追求学术卓越并支持为汤森路透客户提供新颖且令人兴奋的高增长产品。关于该职位在这个机会中，作为研究科学家，您将： • 创新：您将创新并创建处于AI研究前沿的最新代理AI/LLM代理方法。您将贡献想法并在代理环境中使用丰富的数据解决现实世界的挑战。 • 实验和开发：您将参与整个研究和模型开发生命周期，包括头脑风暴、编码、测试，并在国际领先学术会议上提交高质量报告。 • 合作：在汤森路透内部和我们在世界领先大学的学术合作伙伴中，与全球研究工程师团队合作。 • 沟通：积极参与通过研讨会、讲座、会议和/或分享出版物和/或技术资产（数据和模型）与更广泛的社区分享我们的技术发现。关于您如果您的背景包括以下内容，您将适合该职位：必需资格： • 已完成或正在攻读相关学科的博士学位。 • 在顶级会议（例如，NeurIPS、ICML、ICLR、ACL、EMNLP、NAACL、ICLR）中作为第一作者发表论文，特别关注代理系统、工具使用或多代理协调。 • 熟悉一个或多个深度学习框架（例如pytorch、jax、tensorflow等）。 • 出色的沟通技巧，能够清晰地口头和书面报告和展示研究成果和发展。 • 好奇和创新的性格，能够为相关问题设计新颖且有依据的算法解决方案。 • 自我驱动的态度和在有限监督下工作的能力。 • 能够在快节奏、敏捷的环境中工作，管理不确定性和模糊性。优先资格： • 在顶级会议上发表高影响力的论文或在研究社区中具有其他影响力。 • 在完成博士学位之外的机器学习研究经验（例如，监督、行业经验、领导学术计划等）。 • 深度学习框架和大规模模型训练的丰富经验。 • 在LLM环境中从事基于代理的系统、工具使用AI或多代理协调的丰富经验（例如，创业公司、行业或广泛的开源经验）。 • 强大的软件和/或基础设施工程技能，确保软件交付管理良好，体现在对流行开源库的代码贡献或编写生产代码中。 • 使用云工具和提供商（如Amazon AWS、MS Azure、LambdaLabs或Google Cloud）在分布式节点上训练大规模模型的经验。您将享受： • 学习和发展：在职指导和学习机会，以及使用尖端方法和技术的机会。 • 大量数据、计算和高影响力问题：我们的科学家和工程师可以探索大型数据集并发现新能力和见解。汤森路透以全球知名的路透社新闻机构而闻名，但我们的公司也是法律、企业和税务及会计专业人士信息的领先来源。我们拥有超过60,000 TB的法律、监管、新闻和税务数据。我们还为我们的研究人员和工程师提供访问所有主要云计算平台的机会。 • 具有竞争力的薪酬和福利套餐：在学习新技能的同时获得收入的机会。 #LI-AB1 对您有什么好处？ • 混合工作模式：我们为办公室职位采用了灵活的混合工作环境（每周2-3天在办公室，具体取决于职位），同时提供数字和物理连接的无缝体验。 • 灵活性和工作生活平衡：“Flex My Way”是一套支持性工作场所政策，旨在帮助管理个人和专业责任，无论是照顾家庭、回馈社区，还是找到时间刷新和重置。这建立在我们的灵活工作安排之上，包括每年最多8周的远程工作，赋予员工实现更好工作生活平衡的能力。 • 职业发展和成长：通过培养持续学习和技能发展的文化，我们为人才准备好迎接明天的挑战并提供现实世界的解决方案。我们的“Grow My Way”计划和以技能为先的方法确保您拥有成长、领导和在AI支持的未来中茁壮成长的工具和知识。 • 行业内具有竞争力的福利：我们提供全面的福利计划，包括灵活的假期、两天公司范围的心理健康假期、访问Headspace应用程序、退休储蓄、学费报销、员工激励计划以及心理、身体和财务健康的资源。 • 文化：全球公认的、屡获殊荣的包容和归属感、灵活性、工作生活平衡等声誉。我们以我们的价值观为生：关注我们的客户、竞争取胜、挑战（您的）思维、快速行动/快速学习，以及团结更强。 • 社会影响：通过我们的社会影响研究所在您的社区中产生影响。我们每年为员工提供两天带薪志愿者假期，并提供参与公益咨询项目和环境、社会和治理（ESG）计划的机会。 • 实现现实世界的影响：我们是全球少数几家帮助客户追求正义、真相和透明度的公司之一。与我们服务的专业人士和机构一起，我们帮助维护法治、推动商业运转、抓住不法分子、报道事实，并为全球人们提供可信赖的、无偏见的信息。我们在招聘过程中的AI使用汤森路透利用人工智能（AI）来支持我们全球招聘过程的部分环节。除非您选择退出，我们的AI系统将评估您提供的信息，并将其与职位要求进行比较，并将结果呈现给我们的招聘人员以供进一步审查。AI系统作为支持工具，但始终由人类决定您是否会被考虑担任该职位。汤森路透遵守要求提前披露职位预期薪酬范围的当地法律。基本薪酬范围因地区而异。在加拿大安大略省，该职位的基本薪酬范围为80,000加元至100,000加元。基本薪酬在范围内根据个人的知识、技能和经验以及内部公平性进行定位。基本薪酬是全面的总奖励计划的一部分，该计划还包括灵活和支持性的福利以及其他健康计划。该职位也可能有资格根据企业和个人表现的组合获得年度奖金。关于我们汤森路透通过汇集人们和组织所需的可信内容和技术来指引前进的方向。我们为法律、税务、会计、合规、政府和媒体领域的专业人士提供服务。我们的产品结合了高度专业化的软件和见解，赋予专业人士做出明智决策所需的数据、情报和解决方案，并帮助机构在追求正义、真相和透明度的过程中取得成功。路透社是汤森路透的一部分，是全球领先的可信新闻和新闻提供商。我们依靠来自70多个国家的26,000名员工的才华，在灵活的工作环境中，每个人都有机会做出贡献并在专业上成长。在客观性、准确性、公平性和透明度受到攻击的时代，我们认为追求这些是我们的责任。听起来很激动人心吗？加入我们，帮助塑造推动社会前进的行业。作为一家全球企业，我们依靠所有员工的独特背景、观点和经验来实现我们的业务目标。为了确保我们能够做到这一点，我们在全球所有业务中寻求有才华的合格员工，无论种族、肤色、性别/性别（包括怀孕、性别认同和表达）、国籍、宗教、性取向、残疾、年龄、婚姻状况、公民身份、退伍军人身份或任何其他受适用法律保护的分类。汤森路透自豪地成为提供无毒品工作场所的平等就业机会雇主。我们还根据适用法律为符合条件的残疾人和真诚持有的宗教信仰提供合理的便利。有关请求便利的更多信息，请点击此处。了解更多关于如何保护自己免受虚假职位发布的欺骗，请点击此处。有关汤森路透的更多信息，请访问thomsonreuters.com。

研究科学家，LLM代理（基础研究）

THOMSON REUTERS