高级数据工程师负责支持数据管道、ETL 过程和数据库系统的设计、开发和维护,以支持人工智能和数据科学的项目。该角色涉及确保所有数据工程活动的数据质量、可扩展性和性能。
职责和义务:
• 支持数据管道、ETL 过程和数据库系统的设计、开发和维护,以支持人工智能和数据科学的项目。
• 与数据科学家、人工智能/机器学习工程师及其他利益相关者合作,了解数据需求,确保数据的可用性和质量。
• 在所有数据工程活动中实施数据治理、安全和合规标准。
• 优化数据管道和流程,以实现可扩展性、性能和成本效益。
• 监控和确保数据系统的性能和可靠性,必要时识别和解决问题。
• 及时了解数据工程技术和最佳实践的最新进展。
• 指导和提供建议给初级数据工程师和其他团队成员。
• 向高级管理层和利益相关者准备并展示数据工程报告和文档。
• 参与项目规划,并为项目时间表和交付成果的发展做出贡献。
• 执行首席数据工程师或高级管理层指派的其他与工作相关的职责。
要求:
• 数据工程、计算机科学或相关领域的学士学位。
• 相关认证(例如,谷歌云专业数据工程师、AWS 认证大数据 - 专业)优先考虑。
• 至少 5 年的数据工程或相关领域的工作经验。
• 有设计和实施数据管道、ETL 过程和数据库系统的经验,尤其是针对人工智能或技术驱动产品。
• 精通 Python、SQL 等编程语言。
• 熟悉数据工程工具和框架(例如,Apache Spark、Kafka)。
• 出色的问题解决和分析能力。
• 强大的沟通和人际交往能力。
• 注重细节并致力于质量。
• 深入理解数据工程原则、ETL 过程和数据库管理。
• 熟悉云平台(例如,AWS、Azure、谷歌云)及其数据服务。
• 了解数据治理、安全和合规标准。
• 能够有效管理多个任务并优先排序。
• 能够独立工作和团队合作。