机器学习系统工程师,研究工具

旧金山 1天前全职 网络
226.3万 - 286.4万 / 年
关于 Anthropic Anthropic 的使命是创造可靠、可解释和可引导的人工智能系统。我们希望人工智能对我们的用户和整个社会都是安全和有益的。我们的团队是一个快速增长的承诺研究人员、工程师、政策专家和商业领袖的团队,共同致力于构建有益的人工智能系统。 关于该职位: 我们正在寻找一位经验丰富的机器学习系统工程师加入 Anthropic 的编码和标记化团队。这个跨职能角色将在开发和优化我们微调工作流程中使用的编码和标记化系统方面发挥重要作用。作为我们预训练和微调团队之间的桥梁,您将构建关键基础设施,直接影响我们的模型如何学习和解释数据。您的工作将为 Anthropic 的研究进展奠定基础,使我们的人工智能系统能够更高效、更有效地训练,同时确保它们保持可靠、可解释和可引导。 职责: • 设计、开发和维护在预训练和微调工作流程中使用的标记化系统 • 优化编码技术以提高模型训练效率和性能 • 与研究团队紧密合作,了解他们在数据表示方面不断变化的需求 • 构建基础设施,使研究人员能够尝试新颖的标记化方法 • 实施系统以监控和调试模型训练流程中的标记化相关问题 • 创建强大的测试框架,以验证不同语言和数据类型的标记化系统 • 识别和解决与标记化相关的数据处理管道中的瓶颈 • 彻底记录系统并清晰地向各团队的利益相关者传达技术决策 如果您符合以下条件,您可能是一个合适的人选: • 具备丰富的软件工程经验,且具有机器学习专业知识 • 能够在快速发展的研究环境中应对模糊性并开发解决方案 • 能够独立工作,同时与跨职能团队保持良好的合作 • 以结果为导向,倾向于灵活性和影响力 • 具有机器学习系统、数据管道或机器学习基础设施的经验 • 精通 Python,并熟悉现代机器学习开发实践 • 具备较强的分析能力,能够评估工程变更对研究结果的影响 • 能够承担额外的工作,即使超出工作描述 • 喜欢配对编程(我们喜欢配对!) • 关心您工作的社会影响,并致力于负责任地开发人工智能 强有力的候选人还可能具备以下经验: • 处理机器学习数据处理管道的经验 • 为机器学习应用构建或优化数据编码 • 实施或使用 BPE、WordPiece 或其他标记化算法 • 机器学习数据处理系统的性能优化 • 多语言标记化挑战和解决方案 • 工程直接促进科学进展的研究环境 • 分布式系统和机器学习工作流的并行计算 • 大型语言模型或其他基于变换器的架构(非必需) 申请截止日期:无。申请将持续审核。 该职位的预期基本薪酬如下。我们为全职员工提供的总薪酬套餐包括股权、福利,并可能包括激励补偿。 年薪: $320,000—$405,000 美元 后勤 教育要求:我们要求至少拥有相关领域的学士学位或同等经验。 基于地点的混合政策:目前,我们期望所有员工至少 25% 的时间在我们的办公室工作。然而,某些角色可能需要更多时间在办公室。 签证赞助:我们确实提供签证赞助!然而,我们无法成功为每个角色和每位候选人提供签证赞助。但如果我们向您发出报价,我们将尽一切合理努力为您获得签证,并聘请移民律师协助此事。 我们鼓励您申请,即使您认为自己并不符合每一项资格。并非所有强有力的候选人都会满足列出的每一项资格。研究表明,来自代表性不足群体的人更容易经历冒名顶替综合症,并怀疑自己候选人的实力,因此我们敦促您不要过早排除自己,如果您对这项工作感兴趣,请提交申请。我们认为,像我们正在构建的这些人工智能系统具有巨大的社会和伦理影响。这使得代表性变得更加重要,我们努力在我们的团队中包含各种不同的观点。 我们的不同之处 我们相信,最高影响的人工智能研究将是大科学。在 Anthropic,我们作为一个统一的团队在少数几个大规模研究项目上工作。我们重视影响——推进我们可引导、值得信赖的人工智能的长期目标——而不是在较小和更具体的难题上工作。我们将人工智能研究视为一种实证科学,它与物理学和生物学有很多共同之处,也与计算机科学的传统努力有许多相似之处。我们是一个极具协作精神的团队,并且我们经常举行研究讨论,以确保我们在任何给定时间追求最高影响的工作。因此,我们非常重视沟通能力。 了解我们研究方向的最简单方法是阅读我们最近的研究。这项研究延续了我们团队在 Anthropic 之前所从事的许多方向,包括:GPT-3、基于电路的可解释性、多模态神经元、缩放法则、人工智能与计算、人工智能安全中的具体问题,以及从人类偏好中学习。 来和我们一起工作吧! Anthropic 是一家总部位于旧金山的公共利益公司。我们提供具有竞争力的薪酬和福利、可选的股权捐赠匹配、慷慨的假期和父母假、灵活的工作时间,以及一个可与同事合作的宜人办公室空间。关于候选人使用人工智能的指导:了解我们在申请过程中使用人工智能的政策。