Apache Spark / 大数据开发者

16个月前远程全职
TapLane Inc.

TapLane Inc.

location 多伦多
unsaved
Apache Spark / 大数据开发人员 全职 / 远程或混合 我们正在寻找一位经验丰富的 Apache Spark / 大数据开发人员加入我们充满活力的团队。作为我们数据解决方案团队的一员,您将使用 Apache Spark 和其他大数据技术设计、开发和实施复杂的大数据应用程序。 职责 • 使用 Apache Spark、Hadoop 和其他大数据技术开发可扩展和可维护的应用程序。 • 将复杂的分析模型转化为可扩展的、适用于生产环境的解决方案。 • 应用持续集成和交付的最佳实践。 • 与数据和分析专家合作,努力提高我们数据系统的功能性。 • 设计和实现能够与大量数据进行良好扩展和性能的数据模式和模型。 • 处理数据摄取、处理、存储和向各种应用程序暴露的工作。 • 解决数据问题并进行根本原因分析以解决问题。 资格 • 计算机科学、工程或相关领域的学士学位。 • 5年以上大数据开发人员的专业经验。 • 熟练掌握 Apache Spark 和 Hadoop。 • 熟练使用其他大数据技术和工具,如 HBase、Hive、Kafka 等。 • 具备 Java、Scala 或 Python 等编程语言的经验。 • 熟悉云服务(AWS、Google Cloud 或 Azure)和分布式计算原理。 • 强大的解决问题的能力和独立工作的能力。 • 出色的沟通能力,能够以清晰简明的方式传达复杂信息。 • 理解敏捷方法和 DevOps CI/CD 工具。 技术技能 • 精通编程语言,特别是 Java 和 Python。这些对于开发强大高效的数据处理应用程序至关重要。 • 大量使用 Apache Spark 创建批处理作业以处理大量数据的经验。这是管理和操作大数据的关键技能。 • 能够创建流处理作业以实时处理大量数据的强大能力。这种技能对于处理动态、持续更新的数据至关重要。 • 对于 Kafka 的实时数据流处理有深入的理解和经验。对 Kafka 的专业知识对于管理高吞吐量、容错的流数据至关重要。 • 在 AWS 技术方面有丰富的经验,特别是 EMR(Elastic Map Reduce)、S3、EC2、Lambda 和 Kinesis。了解 AWS Glue、Redshift 和 DynamoDB 是一个加分项。熟悉 AWS 架构和服务对于这个角色至关重要。 • 精通 Apache Spark、Hadoop 和其他大数据工具。 • 熟练使用 SQL、Hive、Pig 等查询语言。 • 能够整合来自多个数据源的数据的能力。 • 了解各种 ETL 技术和框架。 • 熟悉机器学习算法和库。 • 熟练使用 Git 等代码版本控制工具。 如果您是一个技术专业人士,擅长将原始数据转化为有价值的洞察力,如果您对大数据技术,特别是 Apache Spark 充满热情,我们很想听到您的声音。立即申请,帮助我们塑造大数据的未来! 关于公司 TapLane Inc. 是安大略省温莎市一家成立已久的软件开发公司,一直处于创新解决方案的前沿。凭借我们对卓越的不懈追求,我们打造定制化的解决方案,推动企业迈向新的高度,巩固了我们作为行业信赖的领导者的声誉。 工作类型:全职 语言要求灵活: • 不需要法语 工作时间表: • 8小时轮班 • 周一至周五 额外支付类型: • 加班费 教育程度: • 学士学位(优先考虑) 经验: • 软件开发:4年(必需) 工作地点:远程