职位描述:
• 应具备至少8年以上的软件产品开发经验。
• 在Hadoop和Apache堆栈中具有软件开发生命周期的经验。
• 具备流程分析和应用生命周期工具(例如Atlassian工具)的经验将是额外的优势。
• 最好具备与跨职能团队合作完成工作的经验。
• 必须具备任何云平台(AWS/Azure/Google Cloud Platform)的经验。
技术技能
• 具备MapR / Hortonworks / Cloudera的经验。
• 必须具备使用Java/Scala进行编码的经验。
• 必须具备各种关系型数据库管理系统(RDBMS)、数据建模、ETL、数据处理和一定程度的数据分析经验。
• 必须具备很好的SQL掌握能力。
• 必须具备对Sqoop、Flume、Spark/Storm等数据传输工具的很好的了解。
• 必须至少精通一种脚本语言,如Python,Unix/Windows PowerShell。最好还具备Pig脚本知识。
• 必须具备Linux知识。
• 对Hadoop生态系统组件(如HDFS、Map Reduce、Pig、Hive、Sqoop、Flume和Apache HUE)有良好的理解。
最好具备NOSQL和列存储数据库方面的技能。