Hadoop开发者

16个月前全职
Nityo Infotech

Nityo Infotech

location 洛杉矶
unsaved
DB / Hadoop开发人员 您的工作将是什么样的? • 应具备在Cloudera平台上开发的实际经验。 • 开发Unix Shell脚本 • 对Hadoop技术(如Pig、Hive、HBase、HDFS、Spark)有良好的理解,能够分析Hadoop系统上的问题。 • 使用Python API(pySpark)设计、开发和实施性能优越的ETL流水线,部署在AWS EMR上,并使用TWS调度程序进行管理。 • 提供Hadoop版本升级、集群补丁安装的支持。保持集群的高性能。 • 与项目利益相关者建立合作关系,就重要决策提供技术支持。 • 使用AWS原生或自定义编程,在AWS云上设计和实施数据工程、摄取和整理功能。 • 在大数据架构中设计和构建从摄取到消费的生产数据流水线,使用Java、Python、Scala。 • 对当前状态的数据平台进行详细评估,并创建适当的过渡路径到AWS云。您所需要的只有... • 具有Cloudera平台上Hadoop开发活动的经验。具有将Spark作业连续集成/部署到EMR集群的经验,了解在AWS EMR集群中调度Spark应用程序的知识。 • 理解Hadoop MapReduce和Apache Spark之间的区别,熟练使用Git、SVN等代码版本控制工具,设计、构建和操作大规模企业数据解决方案和应用程序,使用一个或多个AWS数据和分析服务与第三方服务(如Spark、EMR、DynamoDB、RedShift、Kinesis、Lambda、Glue、Snowflake)结合使用。 • 具有以下任何一种AWS Athena和Glue Pyspark、EMR、DynamoDB、Redshift、Kinesis、Lambda、Snowflake的经验。 • 在Linux / Unix系统上使用Hadoop工作的2年以上经验。 • 在Yarn上有丰富的经验,具有实际经验的Oozie、HCatalog。 • 与客户/运营经理有良好的沟通能力,倾听并提供答案,强大的解决问题能力,能够收集和吸收信息,愿意在轮班/延长工时工作。 所需经验 3-6年 行业类型 就业类型 永久 地点 印度 最后更新日期:2023-12-22