该职位为混合模式 - 每周两天在密西沙加校园工作。
注意:应聘者需具备强大的数据工程背景,精通生物信息学工具和 Python。
背景:
• 我们是 gRED 数据科学与统计计算小组,专注于开发支持基因组数据交互分析的方法和系统。
• 我们小组有两个主要目标:
• 通过构建高效的数据分析软件系统来促进客户科学研究和发现。
• 开发前沿的基因组数据分析可视化工具,并将其作为开源软件和科学文献进行传播。
• 我们正在寻找一名后端工程师加入我们的团队,帮助进行大规模细胞和组织分析项目的交互分析,使用测序和成像技术。
职责:
• 合作并务实地解决在空间转录组学交互数据分析和可视化前沿遇到的科学软件工程挑战。
• 开发高性能系统,能够从分布式来源查询数据,以支持数据可视化接口。
• 与业务分析师、计算科学家和其他软件工程师合作,理解和概念化科学家在键盘或实验台上工作的复杂新兴需求。
• 与本地和离岸工程团队合作,支持您的软件开发工作。
• 通过开源软件开发为更广泛的科学社区做出贡献。
成功的候选人将满足以下许多要求:
• 生物信息学、计算机科学或相关领域的学士学位或更高学历。
• 在 Python、设计和开发高性能系统及包开发方面有 5 年以上的专业经验。
• 具有科学计算包的经验 - scipy、numpy、pandas 及其生态系统。
• 使用云基础设施(特别是 AWS)建立 API 和数据服务的经验。
• 在软件工程中遵循最佳实践,特别是在可用性、版本控制、测试和适当使用抽象方面的表现。
• 具备生物领域知识,尤其是单细胞基因组学和基本数据分析技能者优先,但不是必需的。
• 熟悉正式的构建/发布/部署和持续集成框架者优先。
必须具备的技能:
• 3 年以上的经验(包括研究生阶段)在高性能计算和云解决方案中使用 Python 开发工具。
• 在数据分析和科学计算中使用高性能文件格式的专业知识(例如:hdf5、zarr、tiledb)。
• 在云(AWS)环境中部署高性能软件的经验。
• 熟悉单细胞 RNA-seq、CITE-Seq 或单细胞 ATAC-seq 数据分析者优先。