角色:知识图谱数据库工程师
地点:加拿大(远程)
永久
职位描述:
概述:
该职位隶属于自适应智能团队的团队领导,主要负责设计、实施和优化图数据库,重点关注利用NebulaGraph/Neo4J/TigerGraph等图应用。该职位涉及到对数据基础设施的开发和维护,确保对大型语言模型(LLM)相关的复杂关系进行高效处理。成功的候选人应该在将数据工程技能应用于现实世界问题方面有卓越的成就记录,具有通过创新思维推动变革的心态,并能够为软件开发生命周期的各个阶段做出贡献。候选人还将定期与各种内部利益相关者和领导层进行互动,以协助制定问题、分配优先级并提供关于项目的状态更新。
成功的候选人应具备以下能力:
· 在各种技术和业务团队之间进行协作
· 参与与业务利益相关者的需求收集会议
· 为积极和包容的环境做出贡献
职责:
· 理解各种数据点和组织
· 设计和实施图数据库,以高效存储和检索不同实体和数据点之间的复杂关系
· 利用NebulaGraph/Neo4j/TigerGraph等创建和管理知识图谱,确保性能和可扩展性最优
· 使用图数据库开发和维护知识图谱,整合领域特定的数据和关系
· 基于大型语言模型(LLM)实施图算法,从知识图谱中提取有意义的见解
· 优化数据库查询,调整图形、索引策略以进行图操作
· 识别和解决性能瓶颈,确保高效的数据检索(检索-增强生成)
· 与应用程序开发人员合作,将图数据库、知识图谱集成到各种流水线中,如前端用户界面、批处理流水线等
· 为应用程序特定需求实施和维护数据安全措施
· 确保符合相关数据保护法规和行业标准
· 与数据科学家、软件工程师和产品经理等跨职能团队密切合作
· 将技术概念和解决方案有效地传达给技术和非技术利益相关者
· 故障排除、改进和扩展持续集成、持续交付和持续部署(CI/CD)流水线
· 撰写设计文档,为新系统组件和现有组件的增强建立共识
· 参与与业务伙伴的问题定义和设计会议,全面了解业务问题
· 研究新的向量数据库及其在再保险领域的应用潜力
· 与慕尼黑再保险公司的其他人工智能和IT团队合作解决共同问题
· 审查来自数据科学家和软件工程师的请求,并在代码库中确保一致性、性能、可读性和安全性
· 制定文档以与其他工程师/科学家分享知识
资格要求:
· 在部署数据库工程解决方案方面具有3年以上相关行业经验
· 软件工程、计算机科学、计算机工程或相关统计学学士或硕士学位
· 对分布式数据库系统有了解
· 熟悉与向量数据相关的机器学习和人工智能概念
· 有云数据库解决方案的经验,尤其是在Azure方面,但对AWS或Google的类似经验也受欢迎
· 在Azure DevOps和Azure Cloud Services(如Azure Blob、Azure Key Vault、Azure Data Factory)方面具有经验,或者对AWS或Google有类似经验
· 在设计和实施图数据库、知识图谱方面有经验,重点关注NebulaGraph或其他类似的Neo4J/TigerGraph等知识图谱应用
· 精通数据库优化、性能调优和查询语言
· 熟悉图算法和知识图谱的数据建模
· 有LLM和其他相关框架(如Langchain、LLamaCPP等)的经验
· 具有相关编程语言的丰富编程经验,如Python、Java、Scala或Cypher
· 对以下任何一项有基本理解:自然语言处理、计算机视觉、机器学习或深度学习
· 有CI/CD流水线、自动化测试、自动化部署、敏捷方法、单元测试和集成测试工具的经验
· 出色的解决问题的能力和在协作团队环境中工作的能力
优秀的沟通能力