职位概述:
Guidepoint寻求一位经验丰富的数据工程师,作为多伦多数据/人工智能团队的重要成员。多伦多技术中心将作为我们新的数据/人工智能团队的基地,致力于构建先进分析的现代数据基础设施和负责任的人工智能开发。这一战略投资对Guidepoint未来的愿景至关重要,旨在开发尖端的生成式人工智能和分析能力,为Guidepoint的下一代研究支持平台和数据产品提供基础。
这个职位要求具备Lakehouse架构的技术能力,推动下一代研究支持平台和基于人工智能/机器学习技术的先进数据产品的开发。首席数据工程师将实施Guidepoint的云数据基础设施,推动组织中的商业智能、分析和人工智能/机器学习应用案例。
关于Guidepoint的技术团队:
Guidepoint的技术团队以解决问题和创建更满意的用户为乐。在Guidepoint努力实现通过个性化知识共享解决方案使个人、企业和世界变得更加智能的使命的过程中,工程团队正在应对挑战,改进我们的内部应用架构,并创建新的人工智能产品,优化我们服务的无缝交付。
你的日常工作将包括💻:
• 设计和开发用于维护Azure Lakehouse、ETL流程、商业智能和数据摄取管道的系统,用于人工智能/机器学习应用案例。
• 创建和支持ETL流水线和表模式,以便为Databricks上的Lakehouse容纳新的和现有的数据源。
• 维护数据治理和数据隐私标准。
• 与数据架构师、数据科学家、分析师和其他业务用户合作,快速全面地分析业务需求,为数据仓库提供数据,优化报告和分析。
• 对内部和外部数据和流程进行根本原因分析,回答特定的业务问题,并找到改进机会。
• 维护技术文档,并指导初级数据工程师遵循数据工程和Lakehouse架构的最佳实践。
• 推动创新,为Guidepoint的下一代研究支持平台的尖端生成式人工智能和分析能力做出贡献。
最低资格✔️:
• 本科学位相关领域5年以上相关经验;或硕士学位3年以上相关经验;或博士学位1年经验。
• 具备卓越的领导技能、战略思维和对数据工程和现代数据架构创新的热情。
• 具备高级的SQL知识和与关系型和NoSQL数据库的工作经验,包括查询编写(SQL),以及对各种数据库(如SQL Server、Neo4J、Elastic、Cosmos)的熟悉。
• 在Azure Databricks上构建和优化数据流水线的经验。
• 深入了解和实践数据工程、数据仓库和Databricks上的Delta Lake。
• 精通Spark、Python、SQL。
• 了解Fivetran的工作知识是一个加分项。
• 成功处理、处理和从大型断开的数据集中提取价值的历史。
• 出色的利益相关者管理和沟通技巧,能够在全球团队之间有效沟通。
首选资格✔️:
• 了解PowerBI、Tableau等BI工具。
• 有Azure Data Factory流水线的构建经验。
• 有构建和部署ML和特征工程流水线到生产环境中使用MLFlow的经验。
• 有从各种业务应用程序(如Salesforce、NetSuite等)构建数据流水线的经验。
• 了解消息队列、流处理和高可扩展数据存储。
• 在合规环境中工作或具备相关知识,包括在软件生命周期中构建和部署合规软件解决方案。
• 熟悉基于云的人工智能/机器学习服务和生成式人工智能工具。
关于Guidepoint:
Guidepoint是一个领先的研究支持平台,旨在提升理解力并赋予我们客户决策过程的能力。凭借创新技术、实时数据和难以获得的专业知识,我们帮助客户将答案转化为行动。
在近150万专家和Guidepoint全球1300名员工的支持下,我们通过按需提供情报和研究来为领先组织的研究提供信息。通过Guidepoint,公司和投资者能够更好地应对当今大量的信息,使其更有用和更有力。
在Guidepoint,我们的成功依赖于员工、顾问和客户群体的多样性,这使我们能够建立起丰富多元的联系。我们致力于制定有助于我们社区营造公平和宜人环境的政策,无论背景、身份还是经验如何。