职位描述:理想的候选人将负责使用 Salesforce 标准和自定义对象设计可扩展、高性能的数据模型。他们将实施数据建模策略,包括处理大数据量的 Big Objects,确保数据完整性和一致性,使用验证规则、自动化和共享规则。此外,他们将整合多个 Salesforce 实例中的数据,以实现统一视图。
候选人还将开发和管理数据管道,以提取、转换和加载(ETL)Salesforce 数据到 AI/ML 平台,将 Salesforce 数据与云数据湖或数据仓库集成,并确保使用 API、中间件或 ETL 工具在 Salesforce 和外部系统之间实现无缝数据流。
此外,候选人将与数据科学家和 ML 工程师合作,提供干净、结构化和可访问的数据,支持 MLOps 管道,确保数据可用性、版本控制和数据来源追踪,并自动化数据验证、再训练触发器和 ML 模型的回滚机制。
候选人必须具备使用 AWS 服务(如 EKS、Lambda、S3、RDS 和 EventBridge)支持可扩展 ML 操作的经验,使用 GitHub Actions 等工具实现数据和模型部署的 CI/CD 管道,并使用 AWS Secrets Manager、KMS 和 VPC 配置确保基础设施安全。
此外,候选人将定义和执行数据治理政策,包括访问控制、数据质量和合规性,维护数据架构、工作流程和 ML 基础设施的文档,并确保数据架构与组织目标和监管标准对齐。
要求:
• 需要具备 AWS 云经验。