Apache Spark / 大数据开发者

16个月前远程全职
TapLane Inc.

TapLane Inc.

location 芝加哥
unsaved
Apache Spark / 大数据开发人员 全职 / 远程或混合 我们正在寻找一名经验丰富的Apache Spark / 大数据开发人员加入我们充满活力的团队。作为我们数据解决方案团队的一部分,您将使用Apache Spark和其他大数据技术设计、开发和实施复杂的大数据应用程序。 职责 • 使用Apache Spark、Hadoop和其他大数据技术开发可扩展和可维护的应用程序。 • 将复杂的分析模型转化为可扩展的、可投入生产的解决方案。 • 使用持续集成和交付的最佳实践。 • 与数据和分析专家合作,努力实现数据系统的更高功能性。 • 设计和实现可以扩展和处理大量数据的数据模式和模型。 • 处理数据摄取、处理、存储和向各种应用程序暴露的工作。 • 解决数据问题并进行根本原因分析以解决问题。 资格 • 计算机科学、工程或相关领域的学士学位。 • 5年以上大数据开发人员的专业经验。 • 熟练掌握Apache Spark和Hadoop。 • 熟悉其他大数据技术和工具,如HBase、Hive、Kafka等。 • 掌握Java、Scala或Python等编程语言的经验。 • 熟悉云服务(AWS、Google Cloud或Azure)和分布式计算原理。 • 强大的解决问题的能力和独立工作的能力。 • 出色的沟通能力,能够以清晰简明的方式传达复杂信息。 • 理解敏捷方法和DevOps CI/CD工具。 技术技能 • 熟练掌握编程语言,特别是Java和Python。这对于开发强大高效的数据处理应用程序至关重要。 • 具有使用Apache Spark创建批处理作业处理大量数据的丰富经验。这是管理和操作大数据的关键技能。 • 强大的创建流处理作业以实时处理大量数据的能力。这种技能对于处理动态、持续更新的数据至关重要。 • 对于实时数据流处理的Kafka的深入理解和经验。精通Kafka对于管理高吞吐量、容错性的流式数据至关重要。 • 丰富的AWS技术经验,特别是EMR(弹性Map Reduce)、S3、EC2、Lambda和Kinesis。了解AWS Glue、Redshift和DynamoDB是一个加分项。熟悉AWS架构和服务在这个角色中至关重要。 • 精通Apache Spark、Hadoop和其他大数据工具。 • 熟练使用SQL、Hive、Pig等查询语言。 • 能够整合来自多个数据源的数据的能力。 • 了解各种ETL技术和框架。 • 熟悉机器学习算法和库。 • 熟练使用Git等代码版本控制工具。 如果您是一个将原始数据转化为有价值洞察力的技术专业人士,如果您对大数据技术特别是Apache Spark充满热情,我们很乐意听到您的消息。立即申请,帮助我们塑造大数据的未来! 关于公司 TapLane Inc. 是安大略温莎地区一家成立已久的软件开发公司,一直处于创新解决方案的前沿。凭借我们对卓越的不懈追求,我们打造定制化解决方案,推动企业获得新的高度,巩固了我们作为行业信任的领导者的声誉。 工作类型:全职 语言灵活要求: • 不需要法语 工作时间表: • 8小时班次 • 周一至周五 额外支付类型: • 加班费 教育: • 学士学位(优先考虑) 经验: • 软件开发:4年(必需) 工作地点:远程