我们正在寻找一名高级机器学习工程师加入我们在BenchSci的知识丰富团队。
您将帮助设计和实施基于ML的方法,以分析,提取和生成复杂的生物医学数据 (如实验协议) 以及来自多个异构来源的结果 (包括公开可用数据和专有内部数据,以非结构化文本和知识图表示) 的知识。您将与一些最聪明的技术人员一起工作,利用最先进的方法来实现BenSci加快药物发现的使命。知识丰富是这一挑战的核心,因为它确保我们能够从广泛,准确和高质量的生物医学数据表示中进行推理并获得见解。
这些数据将被用来通过分类、发现高价值的隐含关系、预测新的见解/假设和其他机器学习技术来丰富BenchSci的知识图谱。您将与您的团队成员合作,将最先进的ML和graph ML/数据科学算法应用于此数据。
你很乐意在一个团队中工作,这个团队突破了尖端ML/AI可能的界限,挑战了现状,在快速失败的环境中专注于价值交付。
您将:
• 分析和操纵由来自多个异构源的数据构建的大型,高度连接的生物知识图,以识别数据丰富的机会和策略。
• 与数据和知识工程专家合作,设计和开发可以在我们的知识图中利用数据的知识丰富方法/策略。
• 提供与分类,聚类,更像这种类型的查询,发现高价值的隐式关系以及在数据中进行推断以揭示新颖的见解有关的解决方案。
• 提供强大、可扩展和生产就绪的ML模型,重点是优化性能和效率。
• 架构和设计ML解决方案,从数据收集和准备,模型选择,培训,微调和评估,到部署和监控。
• 与其他功能的队友合作,如产品管理,项目管理和科学,以及其他工程学科。
• 有时在寻求使用ML来丰富BenchSci知识图中的数据的知识丰富项目中提供技术领导。
• 与其他ML工程师密切合作,确保技术解决方案和方法的一致性。
• 与其他职能部门的利益相关者密切联系,包括产品和科学。
• 帮助确保在您的团队中采用ML最佳实践和最先进的ML方法。参与各种敏捷仪式和相关实践。
您有:
• 至少3年,最好是5年的ML工程师工作经验。
• 在复杂项目上提供技术领导的一些经验。
• 软件工程,计算机科学或类似领域的学位,最好是博士学位。
• 使用敏捷软件开发与高性能ML、数据和软件工程师一起交付复杂ML项目的良好记录。可证明的ML熟练程度,对如何利用最先进的NLP和ML技术有深刻的理解。
• 掌握多个ML框架和库,能够从头开始构建复杂的ML系统。拥有丰富的Python和PyTorch经验。
• 为成功交付强大、可扩展和生产就绪的ML模型做出贡献的跟踪记录,重点是优化性能和效率。
• 具有从架构和技术设计到数据收集和准备,模型选择,培训,微调和评估,再到部署和维护的完整ML开发生命周期的经验。
• 熟悉利用大型语言模型实现解决方案,以及对如何使用检索增强生成 (RAG) 架构实现解决方案有深刻的理解。
• 具有图形机器学习 (即图形神经网络、图形数据科学) 及其实际应用的经验。这是由你的经验与知识图,理想的生物工作,和熟悉生物本体。
• 具有解决复杂问题的经验,并关注潜在解决方案的可扩展性和性能等细节。
• 全面了解软件工程,编程基础知识和使用Python的行业经验。
• 具有数据操作和处理经验,如SQL,Cypher或Pandas。
• 积极主动的态度-您的经理相信自由和责任,并帮助您拥有自己的工作; 如果这种环境适合您,您将表现最好。
• 您有与产品经理,科学家,项目经理,其他学科 (例如数据工程) 的工程师一起在跨职能团队中工作的经验。理想情况下,您与团队中的科学家一起在科学/生物领域工作。
• 优秀的口头和书面沟通能力。可以向工程同行和非工程利益相关者清楚地解释复杂的技术概念/系统。
• 不断寻求与ML/AI领域的前沿进步保持同步的增长心态,并积极参与ML/AI社区。