角色:大数据工程师(具备云经验)
地点:加州阳光谷/德克萨斯州奥斯汀
• 拥有 10 年软件分析、设计、开发、部署和维护软件及大数据应用的专业经验。
• 在大数据实施方面具有丰富经验,熟悉 Iceberg、Tableau、Kafka、Superset、Druid、Hive Metastore、Apache、Ranger、安全性、AWS 等主要组件。
• 具备创建 Iceberg 表并从不同文件格式加载数据的经验。
• 在使用 Sqoop 进行数据导入和导出到 Hive 和 HDFS 方面经验丰富。
• 具备使用 Apache Kafka 的生产者和消费者 API 的经验。
• 精通将 Kafka 与 Spark Streaming 集成,以实现更快的数据处理。
• 具备使用 Spark Streaming 编程模型进行实时数据处理的经验。
• 处理文本文件、序列文件、JSON、Parquet、ORC 等文件格式的经验。
• 广泛使用 Apache Kafka 收集集群中的日志和错误消息。
• 对分布式计算和并行处理框架有出色的知识和理解。
• 具备使用 Hive Megastore 进行分析的经验。
• 具备使用 Superset、Druid 的经验。
• 具备在 EC2(弹性计算云)集群实例上工作、在 S3(简单存储服务)上设置数据存储桶、设置 EMR(弹性 MapReduce)的经验。
• 在 Tableau 上工作经验丰富,并能够从这些系统启用 JDBC/ODBC 数据连接到 Hive Metastore。
• 熟悉版本控制系统,如 GIT。
• 对 UNIX/LINUX 命令有扎实的知识。
• 具备 Python 脚本语言的基本知识。
• 了解 Scrum、敏捷和瀑布方法论。
• 高度积极,致力于最高水平的职业精神。
• 表现出良好的书面和口头沟通能力。能够快速学习并适应新兴技术和范式。