职位名称 - 数据科学家
地点:加拿大/混合
垂直:工程
子垂直:数据
专业领域:数据科学 - 自然语言处理
关于Xlscout.ai:
Xlscout.ai是一个基于云的平台,我们在其中使用人工智能、认知计算、机器学习和其他大数据技术开发了算法,从90个国家的1亿多份技术文件中提取情报。除此之外,我们还开发了一个技术语料库,其中包含30亿多个单词,从处理过的100 GB数据中学习,并建立在一个机器学习模型上。
我们的愿景是通过我们的自然语言处理技术,使全球的知识产权和研发部门加速创新。
所需技能:
● 你应该具备使用Python进行编程和脚本编写的能力。
● 对机器学习算法有扎实的基础。
● 在数据分析过程中使用自然语言处理技术的实际经验。
● 熟悉主题建模、聚类、NLP嵌入、关键词提取等。
● 在深度学习方面有经验 - 序列模型、GRU、RNN、LSTM。最好具备对Bert、GPT等高级自然语言处理模型的了解。
● 文档分类、主题建模:对文本预处理和标准化技术(如分词、词性标注和解析)有深入理解,以及它们在低层级上的工作原理。
● 接触过PyTorch和/或TensorFlow深度学习工具,并能将模型导出用于推理。
● 最好具备在aws/gcp/server上部署模型的知识。
● 最好具备软件开发框架 - Flask的知识。
● 开源LLM的知识:了解开源的大型语言模型,如LLaMA 2、Mistral、Flacon等。
● 微调专业知识:能够对开源LLM和嵌入模型进行微调,以适用于特定应用。
首选资格:
v 工程学学士学位 - 任何学科。
v 对发明披露的技术理解,并能确定搜索重点的解决问题的能力。
v 使用搜索字符串构建和进行专利搜索的解决问题的能力。
v 分析结果并及时完成搜索报告的能力。
v 优秀的书面和口头沟通能力(英语)。
v 优秀的理解和表达能力。
职位类型:全职,实习/合作
薪资:每年36,000.00-40,000.00美元
工作时间:
• 8小时轮班
• 周一至周五
经验:
• 自然语言处理:1年(优先考虑)
通勤能力:
• 加拿大,ON M5A 0W4(优先考虑)
搬迁能力:
• 加拿大,ON M5A 0W4:在开始工作之前搬迁(优先考虑)
工作地点:亲自前往