高级数据科学家

16个月前远程全职
Holmusk

Holmusk

location 芝加哥
unsaved
Holmusk是2019年世界经济论坛技术先锋,正在建立领先的精神健康现实世界证据平台。我们利用数据和先进的分析技术,加速研究并改善精神病学在制药、医疗保健提供者和支付方面的结果。 我们正在寻找一位经验丰富的自然语言处理(NLP)专家担任高级数据科学家(NLP)职位。该职位将作为内部NLP算法在医疗问题中的专家,并负责推动Holmusk真实世界行为健康数据库的定制NLP项目/解决方案的发展。如果这个职位描述让你兴奋,欢迎加入一个多元化、合作的工程师、设计师、数据科学家、健康和商业专业人士的团队,他们热衷于改善医疗保健。 职责 • 理解从非结构化临床医生记录中提取特定数据的要求,并负责NLP模型开发的完整生命周期,从问题定义和数据收集到模型训练、验证和部署。 • 与初级数据科学家合作开发NLP模型,包括代码审查、代码库的维护以及代码/模型版本控制。 • 与跨职能团队密切合作,包括工程师、临床医生和产品经理,将NLP解决方案集成到更广泛的系统和应用程序中。 • 负责根据经理的要求创建包括模型洞察、用例和出版物在内的材料,并确保模型开发具有科学严谨性。 我们所寻找的人才 • 计算机科学、数据科学、统计学、应用数学、生物工程或相关领域的硕士或博士学位,来自认可的学院。 • 熟练掌握Python/SQL,扎实的编程技能。 • 至少3到4年处理端到端NLP项目的经验。 • 在预训练、微调BERT、GPT、Llama等大型语言模型用于NLP任务(如信息提取、NER和文本分类)方面有实际经验。 • 具有机器学习/深度学习模型的持续集成和部署流水线经验。 • 对TensorFlow、PyTorch、AWS、MLOps、Docker、Lang Chain Agents和其他相关技术等工具和框架有良好的工作知识。 • 能够及时了解NLP和相关工具的最新进展,并在适用时将其整合到开发过程中的候选人。 优选技能 • 有生成式人工智能和其他专门的NLP技术(如提示工程、RAG等)的经验。 • 对模型可解释性和可解读性的最佳实践有了解,特别是在医疗/生物医学领域。 在Holmusk,我们为我们多元化的员工队伍和包容性的文化感到自豪。我们相信,只有各种各样的人才才能构建最好的产品,并为医疗保健领域带来真正的变革。