从第一方和第三方数据源中提取数据,为高级分析活动进行拼接和整理。
通过与分析翻译员、数据科学家和云工程师合作,利用数据最佳实践和工具。
研究第一方和第三方数据源,以实现访问并确保相关数据源的可用性。
为云工程师的数据管理和/或架构解决方案的设计和实施提供输入。
与云工程师和ML工程师合作,开发和演进数据运营的概念。
设计、实施和部署数据加载器,将数据加载到工程沙盒中。
协助提取、过滤、标记、连接、解析和规范化数据集供使用。
与分析翻译员、数据质量分析师和IT合作解决数据质量问题。
具有设计和实施大规模数据加载、操作、处理、分析和探索解决方案的经验。
具有提取和整理数据的深入技术专长,以及对第一/第三方数据的理解。
具有R、Python、建模、大数据等方面的经验,重点关注Al/ML技术、高级SQL技能以及数据管理原则和流程的理解。
积极设计、开发、交付和支持ML产品和解决方案。
确保ML代码、模型和流水线成功部署到生产环境,并解决问题。
通过ML交付流水线实现模型训练、测试和部署的自动化。
实施可工作、可扩展、生产就绪的ML和Al流程自动化模型和代码。
具备使用PySpark和Data Bricks设计、开发和维护数据管道和ETL过程的知识。
Azure经验是必需的。
编程技能-优先考虑Python经验。
数据库经验-SQL/PLSQL/Snowflake经验是优选。
远程职位-太平洋标准时间。
谢谢,
人才团队
无限与超越公司