关于该职位
我们正在寻找一位经验丰富且具有远见的数据平台团队负责人,负责我们的端到端数据生命周期。在此职位中,您将领导一个由数据工程师、分析师和AI开发人员组成的跨职能团队,构建稳健的数据基础,并部署最前沿的检索增强生成(RAG)和知识系统。
您将弥合复杂的城市/企业数据基础设施与高价值业务洞察之间的差距,确保我们的数据准确、安全、合规且可访问。如果您对现代云原生数据栈、语义AI以及指导技术团队充满热情,我们希望听到您的声音。
主要职责
数据基础设施、空间工程与数据运营
- 在GCP上架构和维护可扩展的云数据仓库解决方案,包括优化城市数据集的空间查询。
- 利用现代编排和数据处理框架领导设计稳健的ELT/ETL管道,以集成多样化的大量数据源。
- 实施数据运营最佳实践,确保所有数据资产的自动化测试、版本控制和可靠的CI/CD管道。
- 开发高效的数据服务层,以确保下游API和应用程序的低延迟访问。
AI、本体论与高级分析
- 使用现代LLM框架、向量数据库和企业AI平台带头开发RAG管道。
- 通过本体论和知识图谱(Graph RAG)将LLM连接到结构化和非结构化的企业知识。
- 推动利用地理空间数据的分析能力,以解锁位置智能和城市洞察。
- 使用现代BI工具监督高影响力的自助仪表板的交付。
战略、治理与合规
- 使用云原生工具建立和执行数据治理框架。确保严格遵守数据本地化法律、隐私框架和沙特个人数据保护法(PDPL)。
- 指导和培养工程师团队,管理冲刺计划,并培养工程卓越文化。
- 与产品和业务领导者合作,将业务需求转化为技术路线图。
资格
必备技能:
- 在数据工程、分析和AI/ML方面有10年以上经验,其中至少4年以上的团队领导或管理角色经验。
- 精通SQL和Python。
- 在现代数据栈中有成功经验,理想情况下是在GCP生态系统中。
- 拥有构建LLM应用程序和语义搜索管道的实践经验。
- 对数据治理实践、目录编制和法规合规(PDPL、GDPR)有深入理解。
- 有实施数据运营原则和工作流编排(例如,Airflow、Dagster)的经验。
加分项:
- 在语义建模、本体论(OWL/RDF)和图数据库(例如,Neo4j)方面有经验。
- 熟悉流数据平台。
- 有基础设施即代码(例如,Terraform)的经验。
- 有地理空间数据(GIS)和空间SQL扩展的经验。
为什么加入我们?
- 影响力:在领导层面直接影响我们的AI和数据战略,处理复杂的城市和企业数据集。
- 技术栈:使用现代云和生成式AI生态系统中的最新工具。