数据科学家(人工智能任务评估与统计分析专家)
小时合同 | 兼职远程 | 每小时 $100 –$120
1. 关于该职位
Mercor 正在与一家领先的人工智能研究实验室合作,招聘具有丰富经验的数据科学家,专注于人工智能任务评估和统计分析。
在这个角色中,您将对金融行业任务中的人工智能代理性能进行全面的故障分析——识别系统性模式,诊断性能瓶颈,并改善模型评估框架。
您将与人工智能工程师和研究分析师密切合作,将原始评估数据转化为可操作的见解,增强大规模人工智能系统的质量、公平性和可靠性。
2. 主要职责
• 统计故障分析:识别人工智能代理在任务组件(提示、评分标准、文件类型、标签等)中的重复故障模式。
• 根本原因分析:确定问题是否源于任务设计、评分标准的清晰度、文件复杂性或代理的局限性。
• 维度分析:检查金融子领域、文件结构和评估标准之间的性能差异。
• 可视化与报告:构建仪表板和分析报告,突出边缘案例、性能集群和改进机会。
• 框架增强:根据实证发现,建议对评分标准设计、评估指标和任务结构进行改进。
• 利益相关者沟通:向数据标记团队、机器学习工程师和研究合作者呈现关键见解。
3. 必要资格
• 扎实的统计分析、假设检验和模式识别基础。
• 精通 Python(pandas、scipy、matplotlib/seaborn)或 R 进行数据分析。
• 具备探索性数据分析(EDA)和特征解释的实践经验。
• 理解人工智能/机器学习评估方法和大型语言模型性能指标。
• 熟练使用 Excel、SQL 和数据可视化工具(如 Tableau、Looker)。
4. 优先资格
• 具有人工智能/机器学习模型评估或质量保证流程的经验。
• 具备金融背景或对学习金融领域结构的兴趣。
• 熟悉基准数据集、故障模式分析和评估框架。
• 2–4 年相关的数据科学、分析或应用统计的专业经验。
5. 更多机会信息
• 工作承诺:兼职,每周 20–25 小时
• 工作时间:完全远程和异步——按自己的时间工作
• 持续时间:1–2 个月,具有强大的延续潜力
• 开始日期:立即
6. 薪酬与合同条款
• 时薪:$100–$120/小时(根据经验和地区而定)
• 分类:独立承包商(通过 Mercor)
• 付款:每周通过 Stripe Connect 支付已批准的工作
⚡ PS:Mercor 每天审查申请。请完成您的面试和入职步骤,以便被考虑此机会。 ⚡