机器学习系统工程师 - 数据与评估,Horizons

纽约 7天前全职 网络
212.4万 - 300.9万 / 年
关于 Anthropic Anthropic 的使命是创建可靠、可解释和可引导的人工智能系统。我们希望人工智能对用户和整个社会都是安全和有益的。我们的团队是一支快速增长的团队,由致力于构建有益人工智能系统的研究人员、工程师、政策专家和商业领袖组成。 关于 Horizons Horizons 团队负责 Anthropic 的强化学习研究和开发,在推进我们的人工智能系统方面发挥着关键作用。我们为所有 Claude 模型做出了贡献,对 Claude 3.5 和 3.7 Sonnet 的自主性和编码能力产生了重大影响。我们的工作涵盖几个关键领域: • 开发使模型能够有效使用计算机的系统 • 通过强化学习推动代码生成 • 开创大型语言模型的基础强化学习研究 • 建立可扩展的强化学习基础设施和训练方法 • 增强模型的推理能力 我们与 Anthropic 的对齐和前沿红队密切合作,以确保我们的系统既有能力又安全。我们与应用生产培训团队合作,将研究创新引入部署模型,并与专注于强化学习的工程团队紧密合作,以大规模实施我们的研究。Horizons 团队位于前沿研究与工程卓越的交汇点,致力于构建高质量、可扩展的系统,推动人工智能的能力边界。 关于这个角色 作为 Horizons 团队的 数据与评估工程师,您将构建使我们的人工智能模型能够有效使用工具和测量其性能的软件基础设施。您将开发和扩展我们的代理框架,创建和实施评估,管理训练数据管道,并应用数据科学技术以提高模型能力。这个以工程为重点的角色将软件开发与实证分析相结合,以推动模型性能和能力的进步。 代表性项目: • 扩展和改进我们的代理框架,使模型能够与工具和环境进行交互 • 设计和实施评估系统,严格测量模型在各项任务中的能力 • 构建和维护用于收集、处理和管理强化学习训练数据的数据管道 • 开发仪表板和分析工具,以从模型性能数据中提取见解 • 与研究人员合作,将评估需求转化为可扩展的生产级系统 如果您符合以下条件,您可能是合适的人选: • 精通 Python 和数据分析库(如 Pandas、NumPy 等) • 有创建数据可视化和交互式仪表板的经验 • 喜欢将复杂的研究问题转化为具体的测量方法 • 具备扎实的软件工程基础,强调干净的 API • 能够清晰地向工程师和研究人员传达技术概念 • 有用于交互式工具的网页开发经验(JavaScript、React 等) • 对测量和提高人工智能能力和安全性充满热情 优秀候选人可能具备: • 有 LLM 特定评估和框架的经验 • 有数据可视化库和框架(D3.js、Plotly、Grafana)的经验 • 熟悉 Jupyter 生态系统和基于笔记本的工作流程 • 了解统计方法和实验设计 • 有用于构建交互式应用程序的网页框架(FastAPI、Flask)的经验 • 有处理大数据集的经验,并理解性能考虑 • 对阅读机器学习研究论文和实现学术文献中的指标感到舒适 优秀候选人不需要具备: • 正式的认证或教育资格 • 有强化学习研究的先前经验 申请截止日期:无。申请将会持续审核。 该职位的预期薪资范围为: 年薪: $300,000—$425,000 美元 后勤 教育要求:我们要求至少拥有相关领域的学士学位或同等经验。 基于地点的混合政策:目前,我们希望所有员工至少有 25% 的时间在我们的办公室工作。然而,某些角色可能需要在办公室工作更多时间。 签证赞助:我们确实提供签证赞助!但是,我们无法为每个角色和每位候选人成功赞助签证。但如果我们向您提供工作机会,我们将尽一切合理努力为您获得签证,并保留移民律师提供帮助。 我们鼓励您申请,即使您认为自己不符合每一项资格。并非所有优秀候选人都符合列出的每一项资格。研究表明,来自少数群体的人更容易经历冒名顶替综合症,并怀疑自己候选人的实力,因此我们敦促您不要过早排除自己,如果您对这项工作感兴趣,请提交申请。我们认为,我们正在构建的人工智能系统具有巨大的社会和伦理影响。这使得代表性变得更加重要,我们努力在团队中纳入多样化的观点。 我们的不同之处 我们相信,影响最大的人工智能研究将是大科学。在 Anthropic,我们作为一个统一的团队,专注于少数大型研究工作。我们重视影响 — 推进我们可引导、值得信赖的人工智能的长期目标 — 而不是在较小和更具体的难题上工作。我们将人工智能研究视为一种实证科学,它与物理学和生物学有着许多共同之处,也与传统的计算机科学研究密切相关。我们是一个极具协作精神的团队,定期举行研究讨论,以确保我们在任何给定时间都在追求最高影响的工作。因此,我们非常重视沟通能力。 理解我们研究方向的最简单方法是阅读我们最近的研究。这些研究延续了我们团队在加入 Anthropic 之前所从事的许多方向,包括:GPT-3、基于电路的可解释性、多模态神经元、扩展法则、人工智能与计算、人工智能安全中的具体问题,以及从人类偏好中学习。 来和我们一起工作吧! Anthropic 是一家总部位于旧金山的公共利益公司。我们提供具有竞争力的薪酬和福利,选择性股票捐赠匹配,慷慨的假期和父母假期,灵活的工作时间,以及一个宜人的办公空间,以便与同事合作。