我们是一家专业的人工智能保障和测试公司,专注于验证医疗人工智能系统的准确性、稳健性、可解释性、公平性、可重复性和安全性。我们的工作支持医院、监管机构、初创公司和医疗器械公司,确保临床级模型性能。
随着医疗保健人工智能的加速采用,未来十年需要强有力的评估和保障实践,以确保临床安全性、可靠性和信任。大多数组织缺乏客观测试医疗人工智能系统的专业知识,特别是在放射学中,诊断准确性和稳健性直接影响患者结果。
我们正在寻找一位负责人工智能的科学家,感兴趣于评估和测试以放射学为重点的计算机视觉系统。您将帮助设计和运行评估管道,用于分析胸部X光片、骨折、乳腺摄影和其他高风险成像任务的模型。这个角色非常适合那些拥有强大分析基础并希望直接为提高医疗人工智能安全性做出贡献的人。
您的职责包括:
模型评估与测试
- 设计和执行放射学人工智能模型的评估管道,包括:疾病检测(分类)、疾病定位(边界框、分割图)、多维度评估(年龄、种族、扫描仪类型、图像质量、病理普遍性)。
- 开发与全球医疗人工智能标准一致的数据集采样策略(例如,FDA良好机器学习实践、WHO伦理与治理、欧盟人工智能法案医疗要求)。
- 运行统计性能分析,包括:置信区间、统计显著性测试、案例级错误分类、读者-模型比较(例如,ROC、FROC、kappa)。
- 进行错误分析以识别系统性故障模式(例如,定位伪影、金属植入物、低质量扫描)。
测试框架与流程开发
- 与高级科学家合作,设计和维护医疗人工智能的标准化评估程序,包括:真值创建与验证、与放射科医生的注释工作流程、偏差和子组分析、稳健性和压力测试(图像噪声、旋转、对比度变化、遮挡)、临床安全风险评估,针对不同的模态和疾病类型。
- 使用Python、计算机视觉库和统计框架实现可重复的管道。
跨职能协作
- 与负责人工智能的科学家、放射科医生和软件工程师密切合作,确保评估质量。
- 通过准备详细报告解释方法论、模型行为和风险,支持客户参与。
- 为我们的专有医疗成像数据集的维护和扩展做出贡献,以便进行测试。
文档与研究
- 以清晰、可审计的格式记录测试方法、评估协议和结果。
- 跟踪最新的研究:放射学人工智能、模型稳健性测试、医疗成像的可解释性、全球医疗人工智能法规和标准。
- 为我们的内部知识库和医疗保健人工智能测试产品路线图做出贡献。
您能够:
- 从基本原理出发思考,并在技术、统计、临床和伦理维度上分析问题。
- 清晰而尊重地向技术和非技术利益相关者传达复杂的模型行为。
- 在快速变化、模糊的环境中舒适地工作,需求迅速演变。
- 独立探索新想法,同时专注于关键任务目标。
必需资格:
- 计算机科学、数据科学、生物医学工程、机器学习或相关领域的学士或硕士学位。
- 1年以上构建或评估机器学习模型的经验,理想情况下有计算机视觉的接触。
- 强大的Python技能和对机器学习/计算机视觉框架(PyTorch、TensorFlow、scikit-learn、OpenCV)的熟悉。
- 使用Pandas、NumPy、SciPy和Jupyter进行数据分析的经验。
- 理解基础统计:置信区间、显著性测试、AUC、敏感性/特异性等指标。
- 对处理医疗成像数据集(例如,DICOM、PACS导出)感兴趣。
- 强大的分析思维和对细节的关注。
优先资格:
- 有放射学数据(胸部X光、CT、乳腺摄影、肌肉骨骼成像)经验。
- 了解医疗成像标准:DICOM、IHE配置文件、FDA GMLP。
- 接触过医疗人工智能评估工具(MONAI、MedPy、Pydicom)。
- 理解计算机视觉模型的可解释性技术(Grad-CAM、集成梯度)。
- 有在计算机视觉模型上进行稳健性、偏差或公平性测试的经验。
- 熟悉云环境、MLOps工作流程和可重复的机器学习管道。
我们是谁:
我们是一家使命驱动的企业,专注于使人工智能对世界安全,从其最关键的领域之一——医疗保健开始。我们相信人工智能可以改变临床工作流程,但只有在经过严格测试和治理后才能部署。我们的团队在工程、临床科学、数据治理和人工智能保障的交汇处工作,以确保医疗人工智能系统安全、准确和可信。
我们是从基本原理出发的思考者和实践者,重视深思熟虑的技术开发和强大的伦理基础。我们与医疗保健提供者、监管机构和创新者合作,构建真正改善患者结果的人工智能系统。