数据团队负责人

圣弗朗西斯科 4天前全职 网络
面议
首席数据工程师(Azure/Databricks) 地点:谢菲尔德(每周2天)/ 混合办公 汇报对象:工程副总裁 团队组成:2名数据科学家,1名数据工程师 机会 我们是一家专注于工业物联网数据的智能资产管理公司。我们接收高频工厂和传感器数据,应用机器学习技术,并向分析师和客户提供高价值的可操作见解。 我们正在构建一个与UNS对齐的尖端工业物联网数据平台,具有高度可扩展的架构,以应对我们下一阶段的增长。我们需要一位实干的技术领导者来掌控数据工程领域,帮助从头开始重新架构和构建我们的管道,并指导一个小而有才华的团队。 使命 您将不会维护遗留系统,而是将架构新的系统。您将负责平台内的数据流,设计一个支持实时操作视图和深度历史分析的稳健架构。 技术栈 - 核心:Azure, MQTT, Databricks, Python, SQL, dbt - 存储与服务:Delta Lake, Postgres, TimescaleDB - 建模:MLflow - 可视化:Grafana 主要目标(前6-12个月) - 平台重建:负责在Databricks中重新设计和重建数据转换层(事件总线后)。从临时脚本转向软件工程标准(CI/CD,测试,模块化代码) - 建模实施:支持在整个数据资产中实施“统一命名空间”(UNS),包括模式和路径标准化;机器层次结构和语义关系;以及针对合同的数据验证和处理方法。 - 赋能:建立一个稳定的数据服务层,用于Grafana和分析(通过Databricks/MLflow),为数据科学团队排除障碍。