职位描述
研究助理数据科学家参与生物医学研究项目,运用编程、数据挖掘、统计学、机器学习和可视化技术,协助开发、评估和/或应用用于数据分析的算法、方法和软件。主要职责包括查询数据库、数据清洗和质量控制、监督和无监督机器学习、参数和非参数统计方法、部署生产模型,并协助通过同行评审的出版物和科学会议传达科学发现。编写干净、高效、可重用的代码,并在 GitHub 上进行管理,以执行可重复的分析,并将模型训练和部署到多个环境。
主要职责和责任
协助开发、评估和/或应用计算和统计方法,包括人工智能和机器学习算法及软件,以分析生物医学数据。
协助通过实验室会议、科学会议和同行评审的出版物展示和传达科学结果。
使用必要的编程语言(主要是 R、Python、SQL、neo4j)创建模型的数据库到部署管道。
创建可持续的数据科学基础设施,并遵循数据分析/机器学习最佳实践。
执行数据清洗、质量控制和探索性数据分析,以评估高级分析方法的需求或适用性。
协助研究、资深研究和/或首席研究数据科学家及主要研究者识别数据科学在解决生物医学研究问题中的最佳应用领域。
测试和验证代码,以确保数据应用的稳健性,并通过 GitHub 进行版本控制。
资格
教育背景:
计算机科学、机器学习、应用数学、计量经济学、统计学、工程学、物理学或相关学科的学士学位是必需的。
计算机科学、机器学习、应用数学、计量经济学、统计学、工程学、物理学或相关学科的硕士学位更受欢迎。
经验和技能:
0 到 2 年在医疗保健或制药行业处理生物医学数据的专业经验。
具有中级技能水平的高阶编程语言(如 R 或 Python)的编程经验。大学项目可能被接受。
在 SQL 中具有基本到中级的编程能力。
具有生物医学机器学习经验者优先。