您 热爱 多样性 和 创造力, 我们 欢迎 共享 我们 远景 的 个人, 以 实现 持久 的 影响。 您 独特 的 设计 思维 和 经验 组合 将 帮助 我们 达到 新 的 高度。
作为 JPMorgan Chase 企业部门 AI/ML 数据平台 的 数据工程师 II - Python/Spark/AWS,您 是 一个 敏捷 团队 的 一部分, 该 团队 致力于 以 安全、 稳定 和 可扩展 的 方式 提升、 设计 和 提供 数据 收集、 存储、 访问 和 分析 解决方案。 作为 数据工程 团队 的 新兴 成员, 您 通过 设计、 开发 和 技术 故障排除 执行 数据 解决方案, 涉及 技术 产品、 应用 或 系统 中 的 多个 组件, 同时 获得 在 您 的 职位 中 成长 所需 的 技能 和 经验。
工作 职责
• 设计 和 构建 可扩展、 高性能 和 可靠 的 数据 管道。
• 收集、 分析、 建模 和 转换 数据集, 从 大量 结构化 和 非结构化 数据 中 提取 有价值 的 见解。
• 组织、 更新 和 维护 收集 的 数据, 以 帮助 使 数据 可操作。
• 在 设计 和 实施 与 数据 交付 相关 的 解决方案 时 提供 技术 专业知识。
• 确保 遵守 数据 治理 原则, 实施 数据 质量 检查, 并 在 数据 生命周期 中 维护 数据 血统。
• 与 跨职能 团队 合作, 收集 业务 需求 并 将其 转化 为 有效 的 数据库 设计 和 数据 流。
• 准备 关于 数据库 设计、 数据 流 架构 和 管道 编排 的 准确 文档。
• 展示 对 数据 系统 组件 的 基本 知识, 以 确定 确保 安全 数据 访问 所需 的 控制。
• 负责 在 一到 两 个 工具 中 进行 自定义 配置 更改, 以 根据 业务 或 客户 请求 生成 产品。
所需 资格、 能力 和 技能
• 在 软件 工程 概念 上 进行 正式 培训 或 认证, 并 具有 2 年 以上 的 应用 经验。
• 对 数据 生命周期 和 数据 管理 功能 有 基本 知识。
• 精通 SQL、 ETL、 数据 建模 和 Python。
• 具备 使用 Python 和 PySpark 构建 数据 管道 的 实践 经验。
• 具备 强大的 数据库 技能, 对 数据库 和 数据 建模 概念 有 透彻 理解。
• 精通 SQL(例如, 连接 和 聚合)。
• 对 NoSQL 数据库 有 工作 理解。
• 具有 统计 数据 分析 的 重大 经验, 能够 确定 适当 的 工具 进行 分析。
• 对 数据 系统 组件 有 基本 知识, 以 确定 所需 的 控制。
优先 资格、 能力 和 技能
• 了解 Apache Iceberg。
• 了解 AWS 及 相关 服务 如 S3、 Glue。
• 了解 管道 编排 工具 如 Airflow、 Argo。
• 了解 版本 控制 系统 如 GitHub。
• 了解 元数据 管理、 数据 血统 和 数据 词汇表。