数据科学家 (人工智能任务评估与统计分析专家)
每小时合同 | 兼职远程 | 每小时 $100 –$120
1. 关于这个角色
Mercor 正在与一家领先的人工智能研究实验室合作,招聘专注于人工智能任务评估和统计分析的经验丰富的数据科学家。
在这个角色中,您将对金融领域任务中人工智能代理的性能进行全面的故障分析 — 识别系统性模式,诊断性能瓶颈,并改善模型评估框架。
您将与人工智能工程师和研究分析师紧密合作,将原始评估数据转化为可操作的洞察,增强大规模人工智能系统的质量、公平性和可靠性。
2. 主要职责
• 统计故障分析:识别人工智能代理在任务组件(提示、评分标准、文件类型、标签等)中的重复故障模式。
• 根本原因分析:确定问题是否源于任务设计、评分标准的清晰度、文件复杂性或代理的局限性。
• 维度分析:检查金融子领域、文件结构和评估标准下的性能变化。
• 可视化与报告:构建仪表板和分析报告,突出边缘案例、性能集群和改进机会。
• 框架增强:根据实证发现建议对评分标准设计、评估指标和任务结构的改进。
• 利益相关者沟通:向数据标注团队、机器学习工程师和研究合作者展示关键洞察。
3. 所需资格
• 扎实的统计分析、假设检验和模式识别基础。
• 精通 Python(pandas,scipy,matplotlib/seaborn)或 R 进行数据分析。
• 具备探索性数据分析(EDA)和特征解释的实践经验。
• 理解人工智能/机器学习评估方法论和大型语言模型性能指标。
• 熟练使用 Excel、SQL 和数据可视化工具(例如,Tableau,Looker)。
4. 优先资格
• 有人工智能/机器学习模型评估或质量保证流程的经验。
• 具备金融背景或对学习金融领域结构的兴趣。
• 熟悉基准数据集、故障模式分析和评估框架。
• 2–4 年相关数据科学、分析或应用统计的专业经验。
5. 有关机会的更多信息
• 工作时间:兼职,每周 20–25 小时
• 工作安排:完全远程和异步 — 自由安排工作时间
• 持续时间:1–2 个月,强烈有延长的潜力
• 开始日期:立即
6. 薪酬与合同条款
• 每小时薪资:$100–$120/小时(根据经验和地区)
• 分类:独立承包商(通过 Mercor)
• 付款:每周通过 Stripe Connect 支付批准的工作
⚡ PS:Mercor 每天审核申请。请完成您的面试和入职步骤,以便考虑这个机会。⚡