数据科学家（人工智能任务评估与统计分析专家）每小时合同 | 兼职远程 | 每小时 $100 –$120 1. 关于这个职位 Mercor 正在与一家领先的人工智能研究实验室合作，招聘具有经验的数据科学家，专注于人工智能任务评估和统计分析。在这个角色中，您将对金融领域任务的人工智能代理性能进行全面的失败分析——识别系统性模式，诊断性能瓶颈，并改善模型评估框架。您将与人工智能工程师和研究分析师密切合作，将原始评估数据转化为可操作的见解，从而增强大规模人工智能系统的质量、公平性和可靠性。 2. 主要职责 • 统计失败分析：识别人工智能代理在任务组件（提示、评分标准、文件类型、标签等）中的重复失败模式。 • 根本原因分析：确定问题是否源于任务设计、评分标准的清晰度、文件复杂性或代理的限制。 • 维度分析：检查金融子领域、文件结构和评估标准中的性能变化。 • 可视化与报告：构建仪表板和分析报告，突出边缘案例、性能聚类和改进机会。 • 框架增强：根据实证发现，建议对评分标准设计、评估指标和任务结构进行改进。 • 利益相关者沟通：向数据标注团队、机器学习工程师和研究合作伙伴展示关键见解。 3. 必要资格 • 扎实的统计分析、假设检验和模式识别基础。 • 精通 Python（pandas、scipy、matplotlib/seaborn）或 R 进行数据分析。 • 具备探索性数据分析（EDA）和特征解释的实际经验。 • 理解人工智能/机器学习评估方法和大语言模型性能指标。 • 熟练使用 Excel、SQL 和数据可视化工具（例如 Tableau、Looker）。 4. 优先资格 • 具有人工智能/机器学习模型评估或质量保证管道的经验。 • 具备金融背景或有兴趣学习金融领域结构。 • 熟悉基准数据集、失败模式分析和评估框架。 • 2–4 年相关的数据科学、分析或应用统计的专业经验。 5. 更多关于这个机会的信息 • 工作承诺：兼职，每周 20–25 小时 • 工作时间：完全远程和异步——按自己的时间工作 • 持续时间：1–2 个月，具有强烈的延长潜力 • 开始日期：立即 6. 薪酬与合同条款 • 每小时费率：$100–$120/小时（根据经验和地区而定） • 分类：独立承包商（通过 Mercor） • 支付：每周通过 Stripe Connect 支付已批准的工作 ⚡ PS：Mercor 每天审核申请。请完成您的面试和入职步骤，以便被考虑这个机会。⚡

自由职业数据科学家（远程 | 每小时 $100–$120）

Call For Referral