高级数据安全架构师
Mphasis 利用下一代技术帮助企业在全球范围内转型。
我们正在寻找一位具有数据分析经验的高级数据架构师,要求熟悉 Databricks、Pyspark、Python 以及 ETL 工具(如 Informatica)。
• 具备在 AWS 上使用 Databricks、Pyspark 和 Python 进行数据分析的实践经验。
• 必须具备使用 GenAI 自动化选项将数据资产迁移到云端的先前经验。
• 有将数据从本地迁移到 AWS 的经验。
职责:
• 设计和实施数据库解决方案。
• 开发 PySpark 应用程序以提取、转换和汇总数据,从而生成洞察。
• 识别、收集和整合来自不同来源的数据,包括内部数据库和电子表格,确保数据的完整性和相关性。
• 使用 Python(Pandas)和 SQL 进行彻底的数据质量检查、清理过程和转换,以准备数据集。