角色概述
Mercor正在与一家领先的AI研究实验室合作开展Vesuvius项目,该项目旨在评估和提升大型语言模型(LLM)在生成结构化、高质量研究计划方面的能力,以解决开放式机器学习问题。
我们正在寻找机器学习研究人员和博士生担任注释员,他们将评估并对AI生成的研究计划提供结构化反馈。目标是改善LLM作为机器学习研究头脑风暴伙伴的功能。
这是一项远程、短期的合作,具有灵活的工作时间,并有机会为前沿AI评估和研究做出贡献。
主要职责
• 评估和比较AI生成的研究计划的清晰度、可行性和技术合理性。
• 基于现实世界的挑战和研究竞赛设计和编制ML任务。
• 为机器学习工作流程起草详细的、可执行的自然语言计划。
• 在Docker环境中用Python实现和验证研究计划。
• 根据结构化评分标准评估输出,提供有用性评分,并提供简明、客观的反馈。
理想资格
• 在应用机器学习领域有5年以上经验或拥有机器学习或相关领域的博士学位。
• 对ML研究方法、实验设计和评估实践有深入理解。
• 优秀的分析和技术写作能力。
• 有ML研究中的可重复性或基准测试经验者优先。
• 注重细节,能够独立提供高质量、结构化的反馈。
合作细节
• 类型:独立承包商
• 模式:完全远程和异步——可以在任何地方按照自己的时间表工作。
• 承诺:每周最多80小时
• 项目名称:Vesuvius
该角色适合重视自主性、精确性和对前沿AI开发有意义贡献的研究人员和工程师。
薪酬与合同条款
• 小时工资:最高可达$140/小时
• 支付方式:通过Stripe Connect每周支付
• 合同类型:独立承包商合作
• 结构:远程、基于里程碑的评估,具有灵活的时间安排
• 申请流程
• 提交简历或CV,突出相关的ML研究或工程经验。
• 完成一个简短的基于AI的面试和一个关于可重复性和模型基准测试经验的简短问卷。
• 被选中的候选人将收到详细的入职材料和项目环境的访问权限。
关于Mercor
Mercor是一个全球人才市场,将优秀的专业人士与领先的AI实验室和研究机构连接起来。我们的使命是赋能专家直接为全球最具影响力和技术先进的AI项目做出贡献。Mercor得到了Benchmark、General Catalyst、Adam D'Angelo、Larry Summers和Jack Dorsey等投资者的支持。来自各个学科的数千名专业人士——从研究和工程到法律和设计——已经加入Mercor,共同构建下一代人工智能系统。