关于职位:数据与推理首席工程师
我们的客户
一家总部位于旧金山的快速发展的风险投资支持的广告技术初创公司,正在寻求改变企业对企业营销人员与理想客户的连接方式。凭借一千二百万美元的资金,他们正在开创身份解析技术,将商业和消费者信号合并,将静态受众列表转变为高度匹配和跨渠道的细分,而无需依赖于Cookie。通过将第一方和第三方数据转化为在Meta、Google和YouTube等平台上精确定位的受众,他们使营销团队能够实现更高的匹配率,减少广告支出的浪费,并推动管道增长。凭借对传统以消费者为中心的渠道中商业买家行为的深刻理解,他们正在重新定义企业品牌的需求生成和基于账户的营销方法。
关于我们
Catalyst Labs是一家顶级人才代理机构,专注于应用AI、机器学习和数据科学招聘。我们以深度参与客户的招聘工作而自豪,与创始人、CTO和AI负责人密切合作,从模型优化到AI驱动的工作流程,推动应用智能的未来。我们专注于将您的技术技能与创造性解决问题的能力和在快速发展的智能系统领域中的长期增长机会相结合。
地点:旧金山
工作类型:全职
薪酬:高于市场的基本工资+奖金+股权
角色与职责
- 领导从数据摄取到洞察的综合数据平台的设计、开发和扩展,确保快速、可靠和业务就绪的数据。
- 构建和维护可扩展的批处理和流处理管道,将多样化的数据源和API转化为可信赖的低延迟系统。
- 拥有并优化数据的可靠性、成本和服务水平目标,目标为99.9%的正常运行时间和分钟级延迟,同时进行根本原因分析并提供可持续的解决方案。
- 操作增强和丰富数据的推理管道,使用大型语言模型和检索增强生成进行丰富、评分和质量保证。
- 跨团队协作以交付数据作为产品,建立明确的数据合同、所有权模型、生命周期流程和以指标为导向的决策。
- 指导数据湖和管道堆栈的架构决策,记录内部开发与外部采购的血统、权衡和决策方法。
- 扩展与API和内部服务的集成,确保数据一致性、高质量,并支持实时和批处理导向的用例。
- 指导工程师,审查代码,提高组织内的整体技术标准,同时促进数据驱动决策的最佳实践。
资格
- 计算机科学、计算机工程、电气工程或数学的学士或硕士学位。
- 出色的书面和口头沟通能力,具有积极主动和协作的心态。
- 能够在混合或分布式环境中工作,表现出强烈的责任感和问责制。
- 行动导向,能够识别瓶颈、自动化工作流程,并根据可衡量的结果快速迭代。
- 展示出教授、指导和清晰记录技术决策和模式的能力。
核心经验
- 6到12年构建和扩展生产级数据系统的经验,展示在数据架构、建模和管道设计方面的专业知识。
- 精通SQL(大数据集上的查询优化)和Python。
- 拥有分布式数据技术(Spark、Flink、Kafka)和现代编排工具(Airflow、Dagster、Prefect)的实际经验。
- 熟悉dbt、DuckDB和现代数据堆栈;具有基础设施即代码(IaC)、持续集成/持续部署(CI/CD)和可观测性的经验。
- 接触过Kubernetes和云基础设施提供商(AWS、GCP或Azure)。
- 加分项:强大的Node.js技能,便于更快的入职和无缝的系统集成。
- 在高增长初创公司(10到200名员工)或早期阶段环境中有过经验,具备扎实的产品思维。