职位名称:AI/ML 架构师(Databricks)
地点:加利福尼亚州洛杉矶(混合办公)
角色概述
我们正在寻找一位具备 Databricks 实操经验的 AI/ML 架构师加入我们的团队。理想的候选人应具备强大的分析能力、构建可扩展数据管道和机器学习模型的经验,并能够与跨职能团队合作推动数据驱动的决策。
该职位涉及处理大型数据集、高级分析以及现代数据工程和机器学习框架,主要使用 Azure/AWS 上的 Databricks。
技能与资格
必需
- 计算机科学、数据科学、数学、统计学、工程或相关领域的学士学位或更高学历。
- 3 年以上数据科学或机器学习相关工作经验。
- Databricks 的高级知识,包括:
- PySpark / Spark SQL
- Databricks 笔记本
- Delta Lake
- MLflow
- Databricks 作业和工作流
- 精通 Python 编程(pandas、numpy、scikit learn)。
- 具有大规模数据处理经验。
- 对机器学习算法和统计技术有扎实的理解。
主要职责
数据科学与机器学习
- 使用 Databricks、Python、PySpark 和 MLflow 开发、训练和优化机器学习和统计模型。
- 执行探索性数据分析(EDA),识别大型数据集中的趋势、模式和见解。
- 使用 Databricks MLflow、Delta Live Tables 或其他 MLOps 管道将机器学习模型部署到生产环境。
- 根据业务需求进行 A/B 测试、预测、分割、异常检测或推荐系统。
数据工程与 Databricks 平台
- 使用 PySpark、SQL 和 Databricks 工作流构建可扩展、高性能的 ETL/ELT 管道。
- 使用 Delta Lake 确保数据的高质量、可靠性和性能。
- 优化 Databricks 环境中的集群使用和作业性能。
- 与数据工程师合作,确保为建模提供高质量的数据可用性。
业务协作
- 将业务问题转化为分析解决方案,并向非技术利益相关者展示发现。
- 与产品、工程和业务团队合作,推动数据驱动的决策。
- 以清晰简洁的方式传达复杂的统计概念。
优先条件
- 具有使用 MLOps 框架在生产环境中部署模型的经验。
- 了解 Azure Databricks 或 AWS Databricks 环境。
- 理解 CICD 管道和 DevOps 概念(Azure DevOps、GitHub Actions 等)。
- 熟悉深度学习框架(TensorFlow、PyTorch)者优先。
关键能力
- 强大的分析和问题解决能力
- 能够在快节奏的协作环境中工作
- 出色的沟通和演示技能
- 自我驱动,注重细节