首席分析师 - 云数据工程师(服务规划)

新加坡 11天前全职 网络
面议
- 使用AWS服务(如Amazon S3、Amazon RDS、Amazon Redshift和Amazon DynamoDB)以及Databricks的Delta Lake设计和架构数据存储解决方案,包括数据库、数据湖和数据仓库。集成Informatica IDMC进行元数据管理和数据目录化。 - 创建、管理和优化数据管道,使用AWS服务(如AWS Glue、AWS Data Pipeline和AWS Lambda)、Databricks进行高级数据处理,以及Informatica IDMC进行数据集成和质量管理,以便于数据的摄取、处理和转换。 - 将来自各种内部和外部来源的数据集成到AWS和Databricks环境中,确保数据一致性和质量,同时利用Informatica IDMC进行数据集成、转换和治理。 - 开发ETL(提取、转换、加载)流程,以清理、转换和丰富数据,使其适合于使用Databricks的Spark功能和Informatica IDMC进行数据转换和质量管理的分析目的。 - 监控和优化AWS和Databricks环境中的数据处理和查询性能,进行必要的调整以满足性能和可扩展性要求。利用Informatica IDMC优化数据工作流。 - 实施安全最佳实践和数据加密方法,以保护AWS和Databricks中的敏感数据,同时确保符合数据隐私法规。使用Informatica IDMC进行数据治理和合规性管理。 - 使用AWS服务(如AWS Step Functions、AWS Lambda)、Databricks Jobs和Informatica IDMC进行工作流自动化,实现数据摄取、转换和监控等常规任务的自动化。 - 在AWS和Databricks环境中维护数据基础设施、管道和配置的清晰和全面的文档,Informatica IDMC促进元数据管理。 - 与跨职能团队(包括数据科学家、分析师和软件工程师)合作,了解数据需求,并在AWS、Databricks和Informatica IDMC中提供适当的解决方案。 - 识别和解决与数据相关的问题,并提供支持,以确保AWS、Databricks和Informatica IDMC环境中的数据可用性和完整性。 - 优化AWS、Databricks和Informatica资源使用,以控制成本,同时满足性能和可扩展性要求。 - 跟踪AWS、Databricks、Informatica IDMC服务和数据工程最佳实践的最新动态,推荐和实施新技术和方法。