数据工程师 - 临时

多伦多 29天前全职 网络
面议
关于Terawatt基础设施 百年一遇的自动驾驶和电动汽车转型正在进行中,这将需要数万亿美元的能源和充电基础设施投资,以及用于安置这些设施的房地产。Terawatt是为快速部署自动驾驶和电动车队的公司提供大规模、交钥匙充电解决方案的领导者。无论是城市移动中心,还是为半挂车精心选址的多车队中心,Terawatt都能带来人才、能力和资本,为处于下一代交通工具转型前沿的客户创造可靠且具有成本效益的解决方案。 Terawatt在美国各地的城市中心以及关键物流和运输走廊和物流中心拥有不断增长的场地组合,通过资本、房地产、开发和场地运营解决方案的强大组合,正在建设未来的永久交通和物流基础设施。公司开发、融资、拥有和运营充电解决方案,以降低电气化车队的成本和复杂性。 在Terawatt,我们以谦逊和紧迫感执行,为车队提供量身定制的解决方案,使客户满意并支持交通运输的转型。 职位描述 我们正在寻找一位高技能且积极进取的数据工程师加入我们不断壮大的团队。在这个角色中,您将主要专注于设计和实施可扩展且高效的数据架构,以支持我们的业务需求。您将与数据科学家、分析师和其他跨职能团队密切合作,构建和优化数据管道,确保数据可访问、安全且结构良好,以用于分析和报告。 这个角色的一个关键部分是开发和维护数据模型、数据库和数据湖,同时实施强大的数据治理和质量保证实践。您将推动创建高效且可扩展的数据基础设施,确保与公司的架构标准和最佳实践保持一致。 此外,我们正在寻找一个对构建和维护生产数据湖管道充满好奇心和真正意愿的人,这些管道将原始时间序列数据转化为机器学习准备的特征、训练数据集和批量预测。确保数据质量、可重现性和可靠的再训练,以便机器学习输出,如预测和风险评分,可以被下游系统信赖。 核心职责 - 设计、构建和维护可扩展的数据架构和系统,包括数据湖 - 架构和优化ETL/ELT管道,以实现从多个数据源的无缝数据摄取和转换 - 开发和执行数据治理和质量保证标准,以确保系统间的数据准确性、完整性和一致性 - 实施数据建模和数据库设计的最佳实践,以支持商业智能和分析 - 与数据分析师、科学家和其他利益相关者合作,了解数据需求并提供高效的数据解决方案 - 定期进行数据验证、故障排除和数据系统性能调优,以优化效率 - 构建和维护生产就绪的数据湖管道,将原始数据转化为机器学习准备的特征、训练数据集和可靠的批量预测 优先资格 - 计算机科学、数据工程或相关领域的学士学位 - 3年以上数据工程经验,专注于数据架构 - 精通设计和实施数据仓库、数据库和数据湖 - 具有使用AWS、GCP或Azure等云平台进行数据存储和处理的经验 - 精通SQL并熟悉NoSQL数据库(如MongoDB)。熟悉ETL/ELT流程和工具(如databricks、Airflow或AWS Glue)。具有数据建模、模式设计和性能调优的经验 - 拥有Hadoop、Spark或Kafka等大数据技术的实践经验 - 理解数据治理框架和质量保证流程 我们正在组建一个代表各种背景、观点和技能的团队。在Terawatt,我们不断努力促进包容、谦逊、充满活力的关系和归属感,并欢迎新想法。我们正在成长,并希望您与我们一起成长。我们鼓励来自各个背景的人申请。 如果需要合理的便利条件以充分参与职位申请或面试过程,或履行职位的基本职能,请联系people@terawattinfrastructure.com。 Terawatt基础设施是一个机会均等的雇主。