自由职业数据科学家(远程 | 每小时 $100–$120)

22天前 远程 兼职 网络
712 - 855 / 时 Call For Referral

Call For Referral

旧金山
数据科学家(人工智能任务评估与统计分析专家) 每小时合同 | 兼职远程 | 每小时 $100 –$120 1. 关于这个职位 Mercor 正在与一家领先的人工智能研究实验室合作,招聘具有经验的数据科学家,专注于人工智能任务评估和统计分析。 在这个角色中,您将对金融领域任务的人工智能代理性能进行全面的失败分析——识别系统性模式,诊断性能瓶颈,并改善模型评估框架。 您将与人工智能工程师和研究分析师密切合作,将原始评估数据转化为可操作的见解,从而增强大规模人工智能系统的质量、公平性和可靠性。 2. 主要职责 • 统计失败分析:识别人工智能代理在任务组件(提示、评分标准、文件类型、标签等)中的重复失败模式。 • 根本原因分析:确定问题是否源于任务设计、评分标准的清晰度、文件复杂性或代理的限制。 • 维度分析:检查金融子领域、文件结构和评估标准中的性能变化。 • 可视化与报告:构建仪表板和分析报告,突出边缘案例、性能聚类和改进机会。 • 框架增强:根据实证发现,建议对评分标准设计、评估指标和任务结构进行改进。 • 利益相关者沟通:向数据标注团队、机器学习工程师和研究合作伙伴展示关键见解。 3. 必要资格 • 扎实的统计分析、假设检验和模式识别基础。 • 精通 Python(pandas、scipy、matplotlib/seaborn)或 R 进行数据分析。 • 具备探索性数据分析(EDA)和特征解释的实际经验。 • 理解人工智能/机器学习评估方法和大语言模型性能指标。 • 熟练使用 Excel、SQL 和数据可视化工具(例如 Tableau、Looker)。 4. 优先资格 • 具有人工智能/机器学习模型评估或质量保证管道的经验。 • 具备金融背景或有兴趣学习金融领域结构。 • 熟悉基准数据集、失败模式分析和评估框架。 • 2–4 年相关的数据科学、分析或应用统计的专业经验。 5. 更多关于这个机会的信息 • 工作承诺:兼职,每周 20–25 小时 • 工作时间:完全远程和异步——按自己的时间工作 • 持续时间:1–2 个月,具有强烈的延长潜力 • 开始日期:立即 6. 薪酬与合同条款 • 每小时费率:$100–$120/小时(根据经验和地区而定) • 分类:独立承包商(通过 Mercor) • 支付:每周通过 Stripe Connect 支付已批准的工作 ⚡ PS:Mercor 每天审核申请。请完成您的面试和入职步骤,以便被考虑这个机会。⚡