富士通加拿大正在招聘一名全职、永久的数据科学家，以支持企业级知识管理（KM）现代化项目。该职位专注于AI/ML/NLP开发、语义增强和混合环境中的数据转换，助力交付智能、可扩展的KM解决方案。主要技能： - 数据科学、人工智能、机器学习或计算语言学硕士学位。 - 精通Python及其库，如TensorFlow、PyTorch、Scikit-learn、Hugging Face Transformers、Pandas和lxml。 - 具备监督学习、无监督学习和强化学习模型的经验。 - 擅长NLP技术，包括分词、实体识别、主题建模和语义搜索。 - 具备知识图谱和语义增强的经验。 - 深刻理解XML结构、命名空间和DOM操作。 - 具备关系数据库（PostgreSQL、Oracle、SQL Server）和规范化模式设计的经验。 - 熟悉Git进行版本控制和协作。 - 具备Azure认知服务和DevOps管道的经验。 - 在受监管或公共部门环境中的经验。职责： - 设计和实施用于语义搜索、矛盾检测和内容重写的AI/ML模型。 - 使用RDF、SPARQL和本体设计构建和查询知识图谱。 - 开发和优化用于XML转换的XSLT样式表和XPath表达式。 - 使用DITA XML和文档即代码原则编写和管理结构化内容。 - 使用Python和Talend或Apache NiFi等工具设计和执行ETL工作流程。 - 进行数据沿袭和元数据管理，以确保可追溯性和完整性。 - 与跨职能团队合作，包括架构师、语言学家和内容作者。 - 支持迭代开发周期、快速原型设计和持续集成。 - 将AI框架与SharePoint Online、Microsoft 365和工作流自动化工具集成。必备技能： - 数据科学、人工智能、机器学习或计算语言学硕士学位。 - 精通Python及其库，如TensorFlow、PyTorch、Scikit-learn、Hugging Face Transformers、Pandas和lxml。 - 具备监督学习、无监督学习和强化学习模型的经验。 - 擅长NLP技术，包括分词、实体识别、主题建模和语义搜索。 - 具备知识图谱和语义增强的经验。 - 深刻理解XML结构、命名空间和DOM操作。 - 具备关系数据库（PostgreSQL、Oracle、SQL Server）和规范化模式设计的经验。 - 熟悉Git进行版本控制和协作。 - 具备Azure认知服务和DevOps管道的经验。 - 在受监管或公共部门环境中的经验。加分技能： - 熟悉LLMs（如GPT-4、Claude）用于内容生成和总结。 - 具备FAISS或Pinecone进行语义聚类的经验。 - 接触过FrameNet和其他语言资源以进行语义理解。 - 具备Shell脚本、Typescript、Scala或R的经验。 - 使用Power BI、Tableau或Quicksight进行迁移后分析。 - 理解偏见缓解、可解释性和负责任的AI实践。 - 具备矛盾检测和语义验证的经验。 - 熟悉用于检索增强生成（RAG）的文档分块。一般要求： - 必须居住在魁北克的加蒂诺地区。 - 混合工作安排 - 每周至少三天现场工作，视需要增加额外天数。 - 强大的组织和时间管理能力。 - 对质量的承诺和对细节的关注。 - 能够独立和协作工作。 - 愿意学习新工具和技术。 - 符合可靠性安全状态的资格；在加拿大居住至少五年。 - 具备在多元文化或多语言环境中工作的经验。 - 熟悉敏捷或其他现代项目管理方法。 - 具有远程或混合工作环境的经验。

数据科学家

Fujitsu Canada, Inc.