[角色职责]
[角色职责]
数据工程师的职责是与现有的数据科学家、数据工程师和分析师团队合作,创建数据工具,开发数据摄取和处理管道,确保数据处理优化,并确保数据系统满足STB的业务需求。
该角色需要与数据科学团队密切合作,建立和部署数据管道以支持机器学习模型和分析脚本,开发数据集成,组装复杂数据集并实施流程改进。
数据工程师在提高数据可靠性和质量的同时,确保可扩展的业务流程,并支持团队的数据相关计划中发挥关键作用。
[工作内容]
[工作内容]
项目管理
项目管理并与供应商和内部利益相关者密切合作,交付与数据工程相关的实施,确保在商定的范围和时间内完成交付和目标。
与跨职能团队合作,包括数据科学家、数据工程师、DevOps工程师、产品经理、业务分析师和业务利益相关者,将模型集成并部署到当前的分析平台和生产系统中。
计划、执行和监控项目里程碑,并及时向管理层更新项目进展和问题。
应用工程学科以支持战略业务目标
准备、处理、清理和验证收集用于分析的数据的完整性。
设计、开发和实施自我管理的数据处理和编译管道,涉及关键企业数据领域,以便数据编译业务逻辑可以在内部管理和维护,以保持对不断变化的运营需求的敏捷响应。
审查供应商开发的数据管道的设计和实施,确保它们满足STB业务的运营要求,并重新集成到自我管理的数据编译管道中,以实现无缝的数据处理和编译过程。
与供应商和内部利益相关者密切合作,项目管理和协调数据科学与分析(DS&A)的数据摄取和数据处理管道,跨平台,包括移动应用程序、SaaS平台、本地和合作伙伴系统
帮助架构DS&A的数据集成和数据处理流,涉及外部/第三方数据源、AWS云数据仓库(如Redshift、RDS)和内部本地系统,以支持大规模工作负载
为内部团队提供有关云数据集成最佳实践的指导
识别、设计和实施内部流程改进:自动化手动流程、优化数据交付、重新设计基础设施以提高可扩展性等。
开发监控工具包,以确保集成成功执行,并在集成失败时发出警报
实施最佳实践DataOps流程,以确保我们的数据管道在整个数据生命周期中从数据准备到报告的持续集成、部署和治理。
数据集成和数据管理
与现有团队合作,审查现有的数据集成流程,并改进当前的数据处理管道。
与数据和机构合作伙伴合作,组装满足功能和非功能业务需求的大型复杂数据集。
为设计和开发集成数据模型提供输入,以便在多个结构化和非结构化数据集之间进行分析。
推荐不同的方法以不断提高数据的可靠性和质量,包括帮助审查和增强现有的数据收集程序,以包括用于构建与行业转型相关的分析模型的数据
分析和评估数据源的有效性和准确性(例如,从利益相关者接收的数据集),确保它们符合STB的数据质量标准。
[我们在寻找什么]
[我们在寻找什么]
接受过定量学科培训:
计算机科学、计算机工程、信息学/信息系统、应用数学或统计学。
至少有1-2年相关领域的工作经验,具备开发、部署和维护数据工作流的可证明技能。
具有将数据管道从开发部署到生产的经验将是一个优势。
能够在动态、快节奏的环境中支持和与跨职能团队合作。
良好的英语书面和口头表达能力,具备良好的演示和沟通技巧,能够清晰地向业务受众表达复杂的想法、数据/概念和分析结果。
良好的分析能力,注重细节,并具备解决工程问题以产生高质量交付物的能力/经验。
具有处理结构化和/或非结构化数据集的经验是必不可少的。
精通统计编程工具(如R、Python)和数据库脚本语言(如SQL - DQL、DML、DDL)
具有DataOps经验,并通过DevOps流程部署模型和数据工作流将是一个优势。
显示更多 显示更少