工作描述
您将:
• 将数据和机器学习工程的最佳实践应用于部门中
• 与数据科学家合作,以数据和机器学习的思维方式定义项目目标和范围
• 使用不同语言编写代码以运行查询并支持数据分析工作
• 在适当的硬件和基础设施方面协助实施部门内的数据管道;
• 确保团队高效且自动化地提供数据和分析解决方案(如果适用,也可以更广泛地提供)
• 监督和管理数据质量管理、数据清洗和数据交换流程的工作流程
• 生成已部署模型的报告并分析任何数据异常
• 监控生产中的已部署模型,并报告任何数据或模型的异常情况
• 与数据科学家合作,构建数据管道、模型训练管道,以确保可重现性和稳健性
• 与IT合作,将机器学习模型转换为可与其他应用程序集成的API
• 协助开发用于不同数据用途的集中式数据仓库
• 协助开发数据摄取和数据转换架构
• 确保部门内的数据准确、一致且及时
• 研究、构建和设计自主运行的软件,以自动化机器学习操作。
• 研究、构建和设计云基础设施和解决方案,以满足数据和机器学习工程师的需求
• 协助部署部门内的数据科学解决方案
• 在云计算、大数据和机器学习领域推广适当的工具和流程。
• 设计机器学习系统,帮助开发高性能的机器学习模型。
• 设计和实施数据管理的规则和程序
• 推动部门内数据工程和数据管理的标准模式。
• 确保机器学习系统符合IT安全规则
• 识别和培训团队成员的数据和机器学习工程师技能
• 确保遵守负责任的博彩政策(RGP)和所有与赌博相关的法律要求,从而保护俱乐部业务的完整性
• 根据直线经理的指示承担其他职责
关于您
您应具备:
• 数量化学科(如数据科学、统计学、人工智能、计算机科学、工程学或相关学科)的硕士学位。
• 扎实的计算背景,具有大规模生产级编程和脚本编写经验。
• 扎实的数据管理或数据工程经验。
• 扎实的关系数据库经验(SQL Server),以及对各种数据库的工作熟悉程度
• 扎实的面向对象编程经验(C#,Java,C ++),以及其他脚本语言(Python,Matlab,R,VBA)
• 对容器技术和概念(例如Docker,Kubernetes)的了解
• 对大数据及相关技术和方法论的了解,以支持机器学习和人工智能的应用。有云技术经验者优先