高级数据科学家,自然语言处理

15个月前全职
Ancestry

Ancestry

location 纽约
unsaved
当你加入Ancestry时,你加入了一个以人为本的公司,每个人的故事都很重要。我们相信,通过发现我们过去的挣扎和胜利,我们可以在家庭和社区之间建立更深厚的纽带和更有意义的联系。我们才华横溢的科学家、工程师、家谱学家、历史学家和讲故事者团队致力于赋予全球各个背景的客户在个人发现之旅中的力量。 凭借超过300亿个数字化的全球历史记录、1亿多个家谱和2000多万个人的AncestryDNA数据库,Ancestry帮助客户发现他们的家族故事,并对他们的生活有更深入的了解。热衷于将工作致力于丰富人们生活的人?你就属于Ancestry。 我们正在寻找一名具有自然语言处理(NLP)领域专业知识的高级数据科学家,加入我们的集中式数据科学团队,并向CV/NLP经理汇报。您将开发先进的解决方案,解决各种支持家族历史和DNA产品的挑战性问题。 你将做什么... 与业务领导合作,为利用NLP从我们数十亿的家谱记录和Newspapers.com档案中提取价值和数据驱动的见解建立愿景; 使用数据科学和机器学习推动产品改进、客户成功、营销优化等,涵盖我们的家族历史和DNA产品; 帮助倡导数据驱动的文化,并通过开发一流的数据科学和NLP能力推动长期的商业价值创造; 与专业领域专家合作,将他们的深入知识注入到模型创建过程中; 与工程团队密切合作,优化NLP算法和深度学习模型,提供模型改进,并将模型高效部署到生产系统中; 你具备什么... 计算机科学、统计学、数学、语言学、工程学或数据相关领域的博士学位; 至少3年的实际技术经验,在生产环境中开发和部署NLP深度学习和机器学习模型; 至少2年的指导和领导工程团队的经验; 直接的工业经验,具有从构思、目标制定到实施和交付的多个数据科学项目的领导能力; 广泛的机器学习和NLP方法背景,包括CNN、RNN、迁移学习、注意机制、大型语言模型、转换器、生成模型和嵌入方法; 熟悉NLP技术,如命名实体提取、文档分类、文档摘要、主题建模、关系提取、机器翻译、情感分析、对话系统; 熟练使用Python、Tensorflow、PyTorch、Keras、SciPy堆栈和Scikit-learn、NLTK、spaCy、pandas、numpy等NLP技术; 了解预训练语言模型,如BERT、GPT、T5、Huggingface和XLNet。 附加信息: Ancestry是一家平等就业机会雇主,不因种族、肤色、宗教信仰、国籍、血统、性别、怀孕、性取向、性别认同、性别表达、年龄、精神或身体残疾、医疗状况、军人或退伍军人身份、公民身份、婚姻状况、遗传信息或适用法律保护的任何其他特征而做就业决策。此外,Ancestry将为具有残疾的合格个人提供合理的住宿安排。