职位名称：数据科学工程师地点：芝加哥，伊利诺伊州-远程/混合办公关于我们：在Predictive Sales AI（PSAI），我们正在重新定义技术和智能如何改变数字营销。我们的AI驱动软件使家庭服务企业能够做出更聪明、更快速的决策——通过自动化、预测和精确推动增长。我们正在寻找一位数据科学工程师来构建、扩展和运营预测销售AI（线索评分、管道风险、流失/续约预测、预测和下一步最佳行动建议）背后的数据和机器学习基础。在这个角色中，您将与数据科学、产品和运营紧密合作，交付可信的数据产品和生产就绪的模型管道，以推动可衡量的收入影响。职位概述：作为一名数据科学工程师，您将构建和运行可靠、可扩展的数据管道，将CRM、营销、产品和外部数据整合到良好建模的数据仓库/湖仓数据集中。您将通过强大的质量检查、监控、服务水平协议和持续改进，确保数据准确且生产就绪，同时优化性能和成本。您还将与工程和分析/机器学习团队合作，设计仪器、整合新来源，并交付机器学习就绪的数据集和特征管道，支持文档、CI/CD实践和团队指导。主要职责： - 构建和运营可扩展的数据管道（批处理和必要时的近实时），从CRM、营销平台、产品事件和外部来源摄取数据。 - 开发和优化仓库/湖仓模型，以支持预测建模和客户报告（清晰的模式、文档定义、高效查询）。 - 实施数据质量和可靠性标准：自动验证、异常检测、审计和对账；推动纠正措施和预防。 - 拥有管道的生产就绪性：监控、警报、服务水平协议、事件响应和事后分析与持久改进。 - 通过生成时间感知和防泄漏的机器学习就绪数据集和特征管道来支持机器学习工作流。 - 通过API、连接器和事件流整合新数据源；设计安全且可维护的摄取模式。 - 通过建议仪器、数据架构和可扩展的集成方法，与工程团队在产品计划上合作。 - 通过查询优化、增量处理、分区和计算/存储优化提高性能和成本。 - 为数据工作流的自动化和CI/CD做出贡献：版本控制、测试、部署流程和环境管理。 - 记录系统和最佳实践（数据合同、运行手册、血统、所有权）并通过评审和配对指导初级团队成员。期望特质：我们正在寻找一个有组织、积极主动和注重细节的人。在这个角色中，您将与公司各个团队密切合作。我们正在寻找以下特质： - 具有所有权思维方式，以可靠性为先 - 强大的SQL/Python能力和对数据质量的高度关注 - 深思熟虑地扩展系统（性能/成本意识，可维护的设计） - 在工程、收入运营和分析之间协作沟通 - 良好的文档记录能力，并通过评审/指导支持他人所需技能和经验： - 数据科学、计算机科学、统计学、工程或相关定量领域的硕士学位。 - 3年以上数据工程经验（或等效的生产级管道交付经验）。 - 精通SQL和Python（或Scala）。 - 具有云数据服务（Azure、AWS或GCP）和现代数据仓库/湖仓的实际操作经验。 - 具有使用分布式处理工具（如Spark/Databricks或类似工具）的经验。 - 具备数据建模（维度建模、规范化）和性能优化的工作知识。 - 熟悉操作生产系统（监控、警报、事件响应）并跨团队协作。为什么加入我们？ - 创新环境：成为一个重视创造力并鼓励探索新想法的前瞻性公司的一部分。 - 职业成长：在支持性和动态的团队中获得持续学习和职业发展的机会。 - 综合福利：享受有竞争力的薪水、基于绩效的奖金、灵活的工作安排和强大的福利套餐。 - 协作文化：在以团队为导向的环境中工作，协作和相互尊重推动我们的成功。如果您准备好成为一个创新、以增长为导向的团队的一部分，请立即申请！