高级数据工程师(12个月合同)职位代码:SPE2024

15个月前合同
Evo Outsourcing Solutions Pte. Ltd.

Evo Outsourcing Solutions Pte. Ltd.

location 新加坡
unsaved
职责 通过实施数据摄取管道(从多个来源和不同格式),存储,转换以及它们的提供来处理整个数据生产:数据集市,立方体,报告,数据集以供模型评分(数据科学),API,主要使用Dataiku和Google BigQuery 确保集成管道的设计与总体数据框架一致,与总部的数据技术负责人合作,并根据最佳实践/定义框架 通过优化和重复使用现有资产来参与持续改进方法 参与数据质量控制,监控,报警和技术文档的数据集成处理方面,以及数据管理(数据模型和映射,数据文档,存储库,应用的转换描述等) 深入了解和分析业务挑战,并能够将需求转化为具体技术解决方案的设计,并逐步扩展我们基于Google云平台和Dataiku的数据平台的功能和范围。 根据复杂性和其他活动的工作量提供可靠的工作量估计和计划,以便协调团队的活动。 在最终验证之前,进行单元开发测试并支持业务用户进行测试。 为数据模型的设计和管理以及数据平台架构方面的指导做出贡献(存储库,API等) 建立管道监控和数据平台和API的监控(从功能和数据质量的角度) 分析与数据平台或API使用相关的故障,弱点和支持请求 及时准确地为业务团队提供支持 提出改进措施以优化数据平台(优化现有流程,数据重组,因子化等) 技能/要求 • 掌握Google Cloud Platform中的数据堆栈组件(欢迎认证),包括但不限于:Google Big Query(嵌套字段,分区,合并SQL,授权视图,RLS),云存储,云函数,云作曲家,Google Firestore,Google数据目录或其他云服务的类似服务。 • 熟练使用Dataiku(在Google大查询上):开发Dataiku流程,实施场景,调度,版本管理,发布到生产,管理等。 • 精通复杂SQL查询 • 了解Python是一个加分项 • 具备数据交换架构的开发实践:webservice,API,流式处理。 • 在敏捷团队中进行开发,并使用CI / CD中使用的工具(Git,Bash,CLI,Azure devops,Jira,Confluence) • 了解Microsoft Power BI,数据目录工具,数据质量,数据管理 个人简介: • 管理学,计算机科学或相关领域的学士学位 • 至少3年在IT开发角色中的经验,例如在Google Cloud&Dataiku或类似云服务上进行数据集成