数据架构师 - 多伦多,加拿大

多伦多 29天前全职 网络
面议
数据架构师 地点:远程(多伦多,加拿大) 类型:全职 关于Human Agency 我们正在快速扩张,并且有一个不断增长的机会管道,需要跨学科的优秀人才。我们的使命是引入从创意制作人到技术专家再到创业领袖的个人,他们可以帮助我们实现这一增长的下一个篇章。 我们是一家实干者的公司。领导者亲力亲为,团队扁平化运作,每个人都为产品的交付做出贡献。头衔不能使我们免于反馈或基本原则。我们欢迎批评,快速学习,并不断提高标准。最好的想法在这里获胜,无论它们来自哪里,因为客户信任我们每次都能交付最强的结果。 我们客户的使命、产品和底线是神圣的。我们沉浸在他们的世界中,成为他们目标的管理者和解决大问题的合作伙伴。我们创造的每一个产品、策略或资产都必须既美观又实用;实用、可用并为现实世界的影响而设计。 人是我们最宝贵的资源,我们只有通过招聘推动我们前进的人才才能成长。在战略、工程、设计、数据和运营方面,我们寻找能提高标准并使我们变得更好的团队成员。始终向上招聘,绝不向下。 我们与各种规模的组织合作,探索、设计和实施安全、可扩展且以人为中心的AI策略。我们相信AI应该放大人类潜力,而不是取代它,并且我们在每次合作中都以这种信念进行构建。从咨询和工具到实施和教育,我们在客户所在的位置与他们会面,并帮助他们以符合其使命和价值观的方式整合AI。我们的目标是通过深思熟虑、负责任的创新,赋能团队更聪明地工作、更快地行动,并解锁新的可能性。 在这一切中,我们以目标、爱和冒险为导向。我们与我们关心的人一起做有意义的工作,并使这段旅程成为值得的冒险。因为在Human Agency,我们是谁以及我们如何工作是同一回事。 机会 我们正在寻找一位数据架构师,设计现代、AI就绪的数据架构,涵盖多个客户合作项目。 这个角色位于数据建模、语义层设计、特征工程和AI启用的交汇处。您将架构系统,使数据可靠、可重用,并为商业智能、机器学习和人工智能做好生产准备。 您应该同样擅长为AI驱动的产品设计数据骨干,编写SQL或Python以解锁模型管道,或指导团队在灵活性、成本和负责任的自动化之间进行权衡。 主要职责 数据建模与架构 - 在Snowflake中设计和实施端到端数据架构 - 从原始摄取到分层、事实/维度建模和语义层设计。 - 定义数据模型,在分析师的灵活性与生产的性能和可扩展性之间取得平衡。 - 与工程团队合作,将数据从源应用程序和操作系统集成。 - 建立版本化建模标准和文档,以确保跨领域的一致性。 语义层与指标治理 - 构建或完善语义层,以统一BI工具(如Tableau、Power BI或Looker)中的指标定义。 - 与业务负责人合作定义KPI,批准新指标,并监控采用情况。 - 实施版本化数据集和定义,以支持可靠的分析和报告。 特征存储与ML准备 - 架构特征管道和数据合同,以支持机器学习模型的时间点正确性。 - 与数据科学家和AI工程师合作,实施可重用的特征存储,用于训练(离线)和部署(在线)使用。 - 监控数据质量,防止数据泄漏影响模型性能。 - 支持将预测模型与操作系统连接的事件驱动架构。 AI与代理工作流启用 - 与AI团队合作,将结构化和非结构化数据集成到生成性和代理性工作流中(例如,RAG、协同工具、自动化评估代理)。 - 设计API或事件结构,以近实时提供预测和触发。 - 通过数据工具测量AI驱动工作流的采用和价值。 资格要求 必需 - 7年以上数据工程/分析工程经验,负责大规模生产管道和BI。 - 在拥有和稳定生产数据平台和关键管道方面取得成功。 - 对现代数据平台(如Snowflake)、编排(Airflow)和转换框架(dbt或同等)有深入了解。 - 熟悉数据集成(ELT/ETL)、API、云存储和SQL性能调优。 - 实际数据可靠性经验:可观察性、血统、测试和变更管理。 - 能在模糊、部分记录的环境中有效运作;通过文档和标准快速创建秩序。 - 以前负责业务关键管道的核心操作和可靠性,具有定义的SLO和事件响应。 - 展示了面向客户的经验(咨询/代理或内部平台团队与跨职能利益相关者)和出色的书面/口头沟通(高管简报、研讨会、决策备忘录)。 优先 - 对生成性AI和机器学习有浓厚兴趣。 - 基本的Python脚本能力。 - 实际的生成性AI经验:至少发布过一个端到端工作流(例如,RAG),包括摄取、嵌入、检索、生成和评估。 - 对LLM行为的工作知识(标记、上下文窗口、温度/顶部-p、少样本/工具使用)以及如何为质量/成本/延迟进行调优。 - 熟悉向量搜索(例如,pgvector或托管向量存储)和混合检索模式。 - 评估与安全基础:离线评估工具、轻量级在线A/B测试以及PII和提示注入的保护措施。 - LLM的MLOps:实验跟踪、提示/配置的版本控制、数据和检索图的CI/CD以及生产监控(延迟、成本、漂移)。 - 用于数据/LLM实用程序和服务集成的Python脚本(API、批处理、重试)。 - 熟悉BI工具(Power BI/Tableau)和语义层设计。 - 接触过流媒体、反向ETL和基本的MDM/参考数据管理。 - 安全与治理意识(基于角色的访问、最小特权、数据保留)。 考虑因素 - 教育:学士学位或同等经验。 - 伦理:承诺于道德实践和负责任的AI。 - 出差:偶尔(10-30%)用于客户活动和事件。 - 地点:支持远程工作,优先考虑位于圣路易斯,密苏里州和主要技术中心的候选人。 薪酬 该职位提供具有竞争力的基本工资和基于绩效的奖金。最终薪酬将根据经验、绩效和地点有所不同。 为什么与Human Agency合作 加入一个思考者和建设者的团队,在各个领域创造有意义的影响 - 拥有领导的自主权、成功的资源和成长的空间。 平等机会承诺 Human Agency是一个平等机会雇主。我们重视多元背景,并努力建立一个包容的文化,让每个人都感到受欢迎和赋权。