优秀候选人应具备的技能:
1. 计算机科学学士学位或同等学历(有经验者优先)。
2. 在分布式平台上具有2-3年的Java和Spark开发经验。
3. 熟练使用Hue、Hive、Impala和SQL数据库。
4. 在Linux环境中有3年的专业工作经验。
5. 有2-3年的专业工作经验,熟悉Hadoop堆栈,最好是Cloudera CDH。
6. 在关系数据库设计和开发方面有5-7年的经验。
7. 对Jenkins等自动化工具有扎实的理解。
8. 了解与数据安全相关的最佳实践。
9. 理解Hadoop设计原则、安全性以及影响分布式系统性能的因素。
期望的技能:
1. 1-2年的脚本语言经验,最好是Python、Bash或Scala。
2. 有性能调优查询的经验。
3. 熟悉Solr、Flume、Kafka、Arcadia、Trifacta以及Sentry和Kerberos等安全工具。
4. 有认证的Java开发人员优先。
5. 有面向客户的经验。