2026年初级/助理AI科学家(合同)
项目ID:AIBT_CBM_26_S01_D
我们正在寻找一位积极进取的初级/助理AI科学家,担任Genentech公司生物与翻译AI(AIBT)和计算生物学与医学(CBM)部门的联合、共同指导职位。在AIBT,我们开发用于研究生物学和靶标发现应用的机器学习方法,在这个跨职能角色中,您将与三个小组的导师合作。这个角色提供了开发和应用现代基于序列的机器学习方法用于基因组学的机会,重点是提高变异效应预测和相关能力,以支持下游研究工作。
成功的候选人将具备深度学习和最先进的基于Python的机器学习库的实际经验,并对生物学问题有浓厚的兴趣。候选人将参与利用基础模型序列表示(例如,Decima风格的方法)和已建立的ML最佳实践的工作,以提高预测质量和科学应用的实用性,同时与AIBT、CBM和研究生物学的机器学习科学家、人类遗传学家和生物学家密切合作。
这位初级助理将在联合团队中推动一个项目,研究主题包括提高基于机器学习的变异效应预测在具有挑战性的基因组背景下的性能,开发强有力的评估框架,以及构建产生更稳健和生物学意义更强的输出的建模方法。
职位详情
- 时长:全职6个月,或兼职更长时间,但不超过2026年。
- 地点:加州南旧金山现场。
机会
- 开发和评估用于DNA序列到功能模型的现代机器学习方法,应用于研究生物学。
- 利用序列到功能模型(及相关基础模型)改善下游任务,包括变异效应预测。
- 构建严格的基准测试和分析管道(例如,分层评估、稳健性检查和模型比较研究)以推动明确、可辩护的结论。
- 使用序列模型在高水平上预测和情境化变异的影响。
- 向AIBT、CBM和研究生物学的导师和利益相关者展示研究成果,并为内部报告以及(适当时)出版物或会议演讲做出贡献。
- 使用基因组学数据(如ATAC-seq、RNA-seq、ChIP-seq和/或MPRAs,根据项目需求和数据可用性)训练或微调序列模型。
- 与机器学习科学家和生物学家密切合作,承担具有挑战性和影响力的项目,具有真正的科学相关性。
- 与生物技术行业的ML和生物学科学家和工程师合作。
- 向更广泛的内部观众提交项目工作的最终报告。
- 职业和个人发展机会。
您是谁
所需教育
- 硕士,或正在攻读博士学位,或最近获得以下领域之一的博士学位:计算生物学、计算机科学、生物学或相关计算领域。
所需技能
- 熟悉序列建模概念和工作流程;有序列基础模型(例如,Decima、Borzoi、Enformer、DNA/RNA语言模型或相关)的经验。
- 能够阅读和实施最新ML文献中的想法,包括模型校准,并将其务实地应用于提高模型性能和评估。
- 对基因组学、调控基因组学、变异解释或非编码基因组有强烈的研究兴趣。
- 精通Python,并具有现代深度学习框架(例如,PyTorch或TensorFlow)的经验。
- 之前在细胞生物学和基因表达基本概念方面有教育背景。
优先技能
- 能够将复杂的计算生物学概念传达给技术和非技术观众(例如,出版物、演讲或公共代码库)。
- 熟悉基于回归的统计精细定位模型(例如,SuSiE、FINEMAP、PAINTOR),以识别基因组位点内的因果变异。
- 有将序列模型应用于生物学解释、计算机实验或设计导向工作流程的经验。
- 熟悉常见的基因组学数据类型和工具(基因组注释、区间和大规模数据集)。
- 对顺式调控元件(增强子、启动子)及其如何影响细胞状态和疾病背景下的基因表达感到好奇。
- 具有协作的心态和跨团队连接ML和生物学的热情。