高级自然语言处理数据科学研究员(要求博士学位,仅限美国)

15个月前远程合同
John Snow Labs

John Snow Labs

location 芝加哥
unsaved
公司描述 John Snow Labs是一家屡获殊荣的人工智能和自然语言处理公司,通过提供最先进的软件、数据和模型来加速数据科学的进展。公司成立于2015年,帮助医疗保健和生命科学公司构建、部署和运营人工智能产品和服务。John Snow Labs是2018年年度AI解决方案提供商奖、2019年年度AI平台奖、2019年国际数据科学基金会技术奖和2020年AI卓越奖的获奖者。 John Snow Labs是Spark NLP的开发者,这是企业中最广泛使用的自然语言处理库,并且是世界领先的提供最先进的临床自然语言处理软件的供应商,为全球最大的医疗保健和制药公司提供支持。John Snow Labs是一个全球专家团队,其中20%拥有博士或医学博士学位,53%至少拥有涵盖数据科学、医学、软件工程、药学、DevOps和SecOps的硕士学位。 职位描述 关于职位:加入我们的团队,担任高级自然语言处理数据科学研究员,您将在新颖的医疗项目中应用先进的生成式人工智能、LLM和自然语言处理方法。这个与客户接触的角色要求具备出色的技术能力、研究专业知识和沟通能力,重点是训练和优化自然语言处理/LLM模型,创建稳健的基于Python的推理流水线,并进行彻底的数据分析和模型验证。 主要资格: - 博士学位:必须拥有计算机科学、生物信息学、统计学、医学、生命科学或相关领域的博士学位。拥有较强的学术出版记录者优先考虑。 - 自然语言处理和LLM专业知识:具有自然语言处理和大型语言模型(LLM)的实际开发经验。 - 软件工程:具备编码、软件设计和数据科学的实际经验是必要的。必须具备Python生态系统的人工智能库的实际经验。 - 数据分析能力:熟练掌握探索性数据分析、为机器学习/人工智能准备数据以及统计评估机器学习模型的技能。 - 沟通能力:具备卓越的口头和书面沟通能力,包括与客户的互动。 - 研究和出版能力:具备撰写科学出版物的领导能力。 - 美国居民:必须是美国居民。 理想技能: - 生产级机器学习流水线开发:具备构建和管理生产级文本处理流水线、MLOps和LLMOps工作流程和工具的经验。 - 技术熟练度:熟悉PyTorch、Spark、Databricks、LangChain、Spark NLP、云API(AWS、Azure等)和开发工具(GitHub、MLFlow、Docker等)者优先考虑。 - 医疗背景:医学、制药、生物信息学或生物统计学背景非常有优势。 机会:我们为渴望解决尖端问题、学习和建立职业生涯的专业人士提供长期的自由职业合同。该职位要求每周至少工作30小时,只接受个人申请人(请勿接受代理机构或团队)。100%远程职位。 我们提供: - 职业发展:这是一个定义职业的机会,承诺通过各种工具和技术扩展您的技能和经验。 - 协作环境:与临床和数据科学专家团队合作,产生重大影响。 - 最先进的技术:为推进医疗保健人工智能的最新技术做出贡献,包括对开源项目和同行评审论文的贡献。 - 学习和文化:通过与全球人工智能社区进行知识交流,提供专业发展机会。 申请流程:合格和有兴趣的候选人应通过提交简历、同行评审的出版物清单和软件代码或过去项目的公共示例来申请。