数据科学家,卑诗省癌症中心

温哥华 10天前全职 网络
面议
**工作总结**: 根据省级卫生服务局(PHSA)的使命、愿景和价值观以及战略方向,患者安全是PHSA每个人的优先事项和共同责任,因此,在该职位的所有方面都固有地要求不断提高质量和安全性。数据科学家根据BC癌症的认知计算优先事项,构建和增加能力,并支持我们的认知计算学习系统,以创建和增强从分析质量数据中获得的见解。数据科学家擅长使用大型数据集和机器学习模型寻找产品和流程优化的机会,并测试不同行动方案的有效性。他们使用各种数据挖掘/数据分析技术,并利用他们对整个AI产品生命周期的开发、测试、实施和维护的知识。数据科学家将通过他们的数据驱动见解推动业务成果,并与广泛的利益相关者和职能团队合作。数据科学家将发现隐藏在大型数据集中的解决方案,并与利益相关者合作改进业务流程和结果。 • *职责/责任**: - 作为质量和患者安全的首席数据科学家和战略家,培养和发展BC癌症的坚实和可持续的机器学习基础和能力 - 与卫生局的临床和领导团队密切合作,制定战略、开发和实施AI产品 - 识别、清理和整合来自不同来源的大量结构化和非结构化数据集,以用于ML模型和产品 - 使用高级ML流程将数据从非功能形式(如扫描图像文本)转换为功能形式,以便在进一步的ML模型中使用 - 使用高级ML模型识别模式、趋势和机会,可以进行预测或减少工作量,从而在BC癌症的各个领域产生重大影响 - 通过与开发人员和其他利益相关者合作,领导ML模型的生产实施过程 - 向领导层传达分析解决方案,并在产品生命周期的各个阶段通知领导层AI产品的状态 - 根据需要对已实施的AI产品进行改进 • *资格**: 相当于统计学、数学、计算机科学或其他定量领域的硕士或博士学位,5-7年处理大型数据集和机器学习模型的经验。具备高级AI产品设计和定量数据分析技能,以创建可操作的见解和可衡量的影响。全面了解数据分析、统计方法和机器学习所涉及的原则、流程、程序和方法。在规划、组织和协调AI产品活动方面表现出专业知识。熟练使用高级机器学习方法、机器学习软件包和大型数据集的操作。在统计和数据挖掘技术方面具有知识和经验,包括但不限于:GLM/回归、随机森林、提升、树、文本挖掘、社交网络分析、模拟、场景分析、聚类分析、决策树、神经网络等。具有编写计算机代码、查询数据库和使用统计计算机语言的经验:Python、SQL、R等。具有使用Web服务的经验:Redshift、S3、Spark、DigitalOcean等。具有使用分布式数据/计算工具的经验:Map/Reduce、Hadoop、AWS、Hive、Spark、Gurobi、MySQL等。具有使用Jupyter、Matplotlib、D3、ggplot、Periscope、Business Objects等为利益相关者可视化/展示数据的经验。表现出在知识综合和翻译活动方面的专业知识。表现出有效沟通的能力,包括口头和书面。能够在跨学科环境中协作工作。