2026年暑期实习生 - 大型语言模型(Prescient Design / 药物发现的人工智能)

纽约 30天前全职 网络
面议
该职位已过期,不再接受申请。
职位 2026年暑期实习生 - 大型语言模型(Prescient Design / AI药物发现) 部门概述 在Roche的AI药物发现(AIDD)团队(前身为Prescient Design),我们正在通过尖端的机器学习技术革新药物发现。我们正在寻找有志于构建机器学习系统的优秀研究人员和工程师,他们对科学数据的表示、建模和评估方式进行变革充满热情。 AIDD的基础模型团队正在寻找一名机器学习研究实习生,负责处理结构化生化测量与大型语言模型之间的数据接口,支持下一代药物发现的基础模型,作为我们更广泛的实验室循环方法的一部分。 实习生将与研究人员和工程师密切合作,设计、实施和评估数据转换和建模管道,获得与真实科学数据集和基础模型工作流程的实践经验。该职位非常适合喜欢细致技术推理、实验以及构建可重用组件的候选人,这些组件位于机器学习和科学数据的交汇处。 该团队为多学科研究提供了一个动态且充满挑战的环境,包括访问异构数据源、与全球顶尖学术机构的紧密联系,以及与内部Genentech和Roche团队的合作。 该实习职位位于纽约市,需现场工作。 机会 - 参与支持科学发现和药物开发的大型语言模型的数据和评估组件工作。 - 帮助定义和实现结构化科学数据与自然语言模型输入和输出之间的接口。 - 参与LLM行为的评估,包括任务和数据集之间的稳健性、校准和一致性。 - 设计和运行实验,研究数据表示和预处理选择如何影响模型性能。 - 为共享内部库贡献生产质量的代码、文档和测试。 项目亮点 - 为期12周的全职(每周40小时)带薪实习。 - 项目开始日期为5月/6月。 - 根据地点提供津贴,以帮助缓解与实习相关的费用。 - 拥有具有挑战性和影响力的关键业务项目。 - 与生物技术行业中最有才华的人合作。 您是谁 必需的教育 - 必须正在攻读硕士学位(在读学生)。 - 必须正在攻读博士学位(在读学生)。 必需的专业 计算机科学、机器学习、数据科学、生物信息学或计算生物学、统计学、应用数学、物理学或相关定量领域 必需的技能: - 强大的编程技能,特别是在Python方面,具有编写干净和可维护代码的经验。 - 对机器学习或NLP基础知识有扎实的理解,包括模型训练和评估概念。 - 有在数据分析或建模背景下处理结构化科学或技术数据(如表格、字段或模式)的经验。 - 能够仔细推理实验结果并清晰地传达技术想法。 优先的知识、技能和资格 - 出色的沟通、协作和人际交往能力。 - 补充我们的文化和指导我们日常行为和决策的标准:诚信、勇气和热情。 - 熟悉生物或生化数据(如蛋白质、抗体或测定)。 该职位不提供搬迁福利。 根据纽约市的主要工作地点,该职位的预期薪资范围为每小时50.00美元。实际薪酬将根据经验、资格、地理位置和法律允许的其他与工作相关的因素确定。该职位还符合带薪假期福利。 Genentech是一个机会均等的雇主。我们的政策和实践是根据优点、资格和能力雇用、晋升和对待所有员工和申请人。公司的政策禁止非法歧视,包括但不限于基于受保护退伍军人身份、残疾人身份的歧视,并符合所有联邦、州或地方法律。 如果您有残疾并需要与在线申请流程相关的便利,请通过填写此表格与我们联系:申请人便利。