Machine Learning Engineer

15 months agoFull-time
60K - 100K GBP Informa

Informa

location London
unsaved
Informa是一家领先的国际活动、情报和学术研究集团。 通过数百个强大品牌,我们与专业市场的企业和专业人士合作,提供连接、情报和机会,帮助客户增长、开展业务、取得突破并做出更明智的决策。 Informa Connect, Informa Markets, Informa Tech, Taylor & Francis和Global Support。 Global Support是Informa的第五个部门,在英国、美国、香港和新加坡设有主要服务中心,还有几个较小的地点。 Global Support的同事为Informa的各个业务部门提供共享的高效业务服务和专业知识,使我们的商业团队能够专注于他们的市场和客户。 技术解决方案与服务是Global Support中的一个关键职能,负责管理和发展支撑日常业务运营的关键企业技术领域,包括战略与技术变革、企业架构、企业技术、客户技术、技术运营和信息安全。 我们现在正在建设一个新的Informa,通过增长加速计划II(GAP II),以客户为中心,数字化和数据是核心。 在我们开始一个雄心勃勃的旅程,通过我们的增长加速计划II(GAP II),专注于客户为中心,利用数字化和数据的力量,Informa很高兴宣布我们新的人工智能计划的形成。 这不仅仅是一个创新中心;我们正在寻找一位人工智能数据工程师,帮助在整个集团范围内概述、交付和扩展数据和人工智能的用例。 人工智能数据工程师的职位将负责塑造、创建和整合人工智能解决方案,特别关注自然语言处理、大型语言模型和多模式生成人工智能。 候选人将与团队其他成员、部门同事和数据工程团队紧密合作,进一步推动人工智能的发展和创新。 人工智能工程师将与数据科学家、交付负责人、产品经理、内容专家和技术团队紧密合作,开发、自动化和扩大先进的人工智能解决方案,解决关键客户问题,同时帮助开发方法和可重复使用的解决方案。 作为人工智能数据工程师,您将负责在数据工程过程的各个方面提供技术专长和领导力,从数据获取、标记、嵌入、保护和存储。 整合和管理数据来源: 使用各种数据类型,包括PDF、Word文档、Excel文件、HTML、音频、视频和文本,以及各种数据库,整合和管理组织内的数据。 为人工智能建模准备和预处理数据:准备和预处理数据,确保其为机器学习模型和人工智能解决方案所使用。 开发和维护数据管道:利用Airflow和Python等工具开发和维护高效可扩展的数据管道,支持大型数据集的摄入、转换和交付。 管理数据湖和数据仓库:监督组织的数据湖和数据仓库,确保数据存储高效,并且易于访问以供人工智能应用程序使用。 实施数据质量和治理:确保数据质量高标准,并实施治理实践,以维护数据的完整性和安全性。 与人工智能团队合作:与人工智能主管工程师和其他利益相关者紧密合作,了解数据需求,并为基于人工智能的解决方案的开发做出贡献。 及时了解数据工程、机器学习和人工智能技术的最新发展,不断增强数据能力。 约两年的数据工程经验,专注于人工智能和机器学习项目。 精通Python、Airflow、数据湖和数据管道工具。熟悉JSON、Parquet、Avro等数据格式。 了解数据处理技术:熟悉大数据技术(如Hadoop、Spark、AWS EMR)和数据库管理系统(如)。 了解数据集成工具:熟练掌握ETL/ELT工具和实践。 了解机器学习和人工智能的数据需求,包括嵌入和向量数据库的经验。 解决问题的能力:能够解决复杂的数据集成挑战,并提供高效的解决方案。 沟通能力:具备较强的人际交往能力,能够向非技术人员解释技术数据概念。 计算机科学、数据科学、工程或相关领域的学士或硕士学位。 有使用AWS或Azure等云平台的经验。 了解数据安全和隐私实践。 我们也非常灵活,可以接受不同的工作模式,并优先考虑内部晋升。学习和发展计划,帮助您的职业发展 ~每年约25天的年假,4天用于志愿工作,生日休假1天 ~与高质量的专业产品合作 ~友好而充满活力的员工,都是“专家中的专家”,并提供额外的培训和发展,帮助您实现职业目标 ~定期社交活动和网络交流机会 我们坚信多样性的价值,并创造支持性、包容性的环境,使我们的同事能够成功。 我们不以种族、肤色、血统、国籍、宗教或宗教信仰、精神或身体残疾、医疗状况、遗传信息、性别(包括怀孕、分娩和相关的医疗状况)、性取向、性别认同、性别表达、年龄、婚姻状况、军事或退伍军人状况、公民身份或其他受联邦、州或地方法律保护的特征歧视。在您申请工作时,了解Informa如何处理您的个人数据。