深度机器学习,蛋白质设计高级/首席科学家
位于加利福尼亚州米尔皮塔斯的Henlius USA公司专注于开发和提供高质量、创新和经济实惠的药物,以治疗全球患者的一系列慢性和生命威胁性疾病,重点是免疫肿瘤学。
我们正在寻找一位高度积极的高级/首席科学家,为AI/ML引导的蛋白质设计技术开发做出贡献。他/她将与其他实验室科学家密切合作,开发和优化我们基于AI/ML的抗体/蛋白质设计平台。作为一个高效团队的一部分,您将能够为Henlius的AI/ML平台和研究的成功做出重要贡献,包括:
• 创建目标导向的想法,建立不同类型数据和我们期望的分子之间的联系。长期目标是推进技术,执行全新的蛋白质设计,以针对特定结合域。
• 开发预训练的蛋白质/抗体语言模型(PPLM/PALM),预训练的基于结构的模型(GNN)和其他生成模型,用于特异性抗原结合物设计。
• 挖掘公开可用的数据库。处理来自内部和/或公共数据库的数据。使用统计方法正确评估和解释AI模型的准确性和效率。
• 根据新的可用数据开发用于蛋白质设计的新模型。在训练过程中编写和优化模型和超参数。
• 应用湿实验验证的数据,改进当前的深度学习模型,并识别出更好的结合特异性、亲和力和稳定性的新设计。
要求:
• 在计算机科学、生物信息学、计算生物学、结构生物学或相关领域拥有AI深度学习方向的博士学位。
• 在学术界或生物技术/制药环境中使用计算研究方法的工作经验。
• 必须具备科学计算语言(如Python)、使用深度学习库(如Tensorflow、PyTorch)和云计算(AWS、Google Cloud等)的强大专业知识。
• 必须具备在生物序列数据或自然语言处理(NLP)应用中应用多种深度学习方法(扩散模型、Transformer、GNN、GAN、RNN和CNN等)的丰富实践经验,通过同行评议的出版物或已发表的项目予以证明。
• 强大的数学技能(如统计学、代数学)。使用最常见的框架(如Numpy、Pandas、Matplotlib、Seaborn、Scikit-Learn、Keras)进行强大的数据处理、分析和统计技能。
• 数据挖掘经验。
• 蛋白质序列和结构生物信息学经验者优先。
• 蛋白质结构建模和对接经验者优先。
• 具备蛋白质/抗体设计经验的生物学背景者优先,但不是必需的。
• 具备解决问题的能力,适应多学科环境,具有良好的合作精神。
• 优秀的沟通能力(口头和书面)。