人工智能/机器学习技术项目经理 - 数据标注与大型语言模型

圣弗朗西斯科 3天前全职 网络
面议
Databricks研发运营组织正在寻找一位积极主动且技术娴熟的技术项目经理(TPM),以领导和监督支持我们尖端AI研究计划的数据标注项目。该角色位于项目管理、数据运营和AI/ML的交汇处,将在确保我们的数据标注工作具有可扩展性、高质量,并与我们的研究和产品团队的需求保持一致方面发挥关键作用。 您将与研究人员、数据科学家、ML工程师和供应商运营密切合作,推动大规模数据标注和策划工作的端到端生命周期——从战略和规划到执行、交付和质量评估。 职责 - 项目所有权:推动大规模数据标注项目的端到端实施,从需求范围界定到交付和事后分析。 - 跨职能协作:与AI研究领导、AI研究人员、数据科学家、ML工程师和产品经理合作,定义数据需求、成功指标和标注指南。 - 供应商和劳动力管理:管理外部标注供应商和内部标注团队,包括合同谈判、SLA、质量标准和吞吐量规划。 - 质量和流程:设计和实施强大的质量控制管道、标注工具和反馈循环,以确保大规模数据质量。 - 工具和自动化:与工程团队合作,改进标注基础设施、工作流程和数据管道,以提高效率和可扩展性。 - 数据策略和治理:为数据治理最佳实践做出贡献,包括标注工作流程中的隐私、安全、伦理和合规性。 - 报告和指标:定义和跟踪关键项目指标(成本、质量、速度、数量),并定期向利益相关者和领导层沟通进展。 - 内部采用:通过构建入职流程、工作流程和变更管理策略,协调内部采用自主AI产品。 - 数据质量领导:建立和标准化跨数据集和标注团队的数据质量测量、监控和改进流程。 - 客户参与:与外部客户和研究伙伴合作,进行评估研讨会、试点和反馈会议,以推动持续改进。 能力和要求 - 拥有技术领域(如计算机科学、数据科学、机器学习、信息系统)学士或硕士学位或同等实践经验。 - 在数据中心或AI/ML环境中具有7年以上技术项目管理、项目管理或运营经验。 - 对ML开发工作流程、数据管道和标注生命周期有深入理解。 - 具有管理大规模数据标注或数据收集工作的经验,包括与第三方供应商合作。 - 熟悉大数据平台(如Apache Spark、Databricks、Hadoop)和数据仓库概念。 - 具备出色的组织、解决问题和沟通能力,能够影响跨职能利益相关者。 - 拥有推动跨职能团队按时高质量交付复杂技术项目的成功经验。 - 出色的沟通、谈判和分析能力,能够记录标准操作程序和流程。 - 高级SQL知识,能够通过临时SQL、报告和仪表板构建和维护分析以跟踪、预测和可视化消耗。 - 具有对内部和外部数据和流程进行根本原因分析的经验,以回答特定业务问题并识别改进机会。 - 自我激励,能够独立工作,也能在团队环境中工作。 - 优先考虑对GPU技术及其在生成AI和机器学习中的应用有良好工作知识者。 - 熟悉大数据技术,如Apache Spark、Delta Lake和MLflow者优先。