角色概述 Mercor正在与一家领先的AI研究实验室合作开展Vesuvius项目，该项目旨在评估和提升大型语言模型（LLM）在生成结构化、高质量研究计划方面的能力，以解决开放式机器学习问题。我们正在寻找机器学习研究人员和博士生担任注释员，他们将评估并对AI生成的研究计划提供结构化反馈。目标是改善LLM作为机器学习研究头脑风暴伙伴的功能。这是一项远程、短期的合作，具有灵活的工作时间，并有机会为前沿AI评估和研究做出贡献。主要职责 • 评估和比较AI生成的研究计划的清晰度、可行性和技术合理性。 • 基于现实世界的挑战和研究竞赛设计和编制ML任务。 • 为机器学习工作流程起草详细的、可执行的自然语言计划。 • 在Docker环境中用Python实现和验证研究计划。 • 根据结构化评分标准评估输出，提供有用性评分，并提供简明、客观的反馈。理想资格 • 在应用机器学习领域有5年以上经验或拥有机器学习或相关领域的博士学位。 • 对ML研究方法、实验设计和评估实践有深入理解。 • 优秀的分析和技术写作能力。 • 有ML研究中的可重复性或基准测试经验者优先。 • 注重细节，能够独立提供高质量、结构化的反馈。合作细节 • 类型：独立承包商 • 模式：完全远程和异步——可以在任何地方按照自己的时间表工作。 • 承诺：每周最多80小时 • 项目名称：Vesuvius 该角色适合重视自主性、精确性和对前沿AI开发有意义贡献的研究人员和工程师。薪酬与合同条款 • 小时工资：最高可达$140/小时 • 支付方式：通过Stripe Connect每周支付 • 合同类型：独立承包商合作 • 结构：远程、基于里程碑的评估，具有灵活的时间安排 • 申请流程 • 提交简历或CV，突出相关的ML研究或工程经验。 • 完成一个简短的基于AI的面试和一个关于可重复性和模型基准测试经验的简短问卷。 • 被选中的候选人将收到详细的入职材料和项目环境的访问权限。关于Mercor Mercor是一个全球人才市场，将优秀的专业人士与领先的AI实验室和研究机构连接起来。我们的使命是赋能专家直接为全球最具影响力和技术先进的AI项目做出贡献。Mercor得到了Benchmark、General Catalyst、Adam D'Angelo、Larry Summers和Jack Dorsey等投资者的支持。来自各个学科的数千名专业人士——从研究和工程到法律和设计——已经加入Mercor，共同构建下一代人工智能系统。