富士通加拿大正在招聘一名全职、永久的数据科学家,以支持企业级知识管理(KM)现代化项目。该职位专注于AI/ML/NLP开发、语义增强和混合环境中的数据转换,助力交付智能、可扩展的KM解决方案。
主要技能:
- 数据科学、人工智能、机器学习或计算语言学硕士学位。
- 精通Python及其库,如TensorFlow、PyTorch、Scikit-learn、Hugging Face Transformers、Pandas和lxml。
- 具备监督学习、无监督学习和强化学习模型的经验。
- 擅长NLP技术,包括分词、实体识别、主题建模和语义搜索。
- 具备知识图谱和语义增强的经验。
- 深刻理解XML结构、命名空间和DOM操作。
- 具备关系数据库(PostgreSQL、Oracle、SQL Server)和规范化模式设计的经验。
- 熟悉Git进行版本控制和协作。
- 具备Azure认知服务和DevOps管道的经验。
- 在受监管或公共部门环境中的经验。
职责:
- 设计和实施用于语义搜索、矛盾检测和内容重写的AI/ML模型。
- 使用RDF、SPARQL和本体设计构建和查询知识图谱。
- 开发和优化用于XML转换的XSLT样式表和XPath表达式。
- 使用DITA XML和文档即代码原则编写和管理结构化内容。
- 使用Python和Talend或Apache NiFi等工具设计和执行ETL工作流程。
- 进行数据沿袭和元数据管理,以确保可追溯性和完整性。
- 与跨职能团队合作,包括架构师、语言学家和内容作者。
- 支持迭代开发周期、快速原型设计和持续集成。
- 将AI框架与SharePoint Online、Microsoft 365和工作流自动化工具集成。
必备技能:
- 数据科学、人工智能、机器学习或计算语言学硕士学位。
- 精通Python及其库,如TensorFlow、PyTorch、Scikit-learn、Hugging Face Transformers、Pandas和lxml。
- 具备监督学习、无监督学习和强化学习模型的经验。
- 擅长NLP技术,包括分词、实体识别、主题建模和语义搜索。
- 具备知识图谱和语义增强的经验。
- 深刻理解XML结构、命名空间和DOM操作。
- 具备关系数据库(PostgreSQL、Oracle、SQL Server)和规范化模式设计的经验。
- 熟悉Git进行版本控制和协作。
- 具备Azure认知服务和DevOps管道的经验。
- 在受监管或公共部门环境中的经验。
加分技能:
- 熟悉LLMs(如GPT-4、Claude)用于内容生成和总结。
- 具备FAISS或Pinecone进行语义聚类的经验。
- 接触过FrameNet和其他语言资源以进行语义理解。
- 具备Shell脚本、Typescript、Scala或R的经验。
- 使用Power BI、Tableau或Quicksight进行迁移后分析。
- 理解偏见缓解、可解释性和负责任的AI实践。
- 具备矛盾检测和语义验证的经验。
- 熟悉用于检索增强生成(RAG)的文档分块。
一般要求:
- 必须居住在魁北克的加蒂诺地区。
- 混合工作安排 - 每周至少三天现场工作,视需要增加额外天数。
- 强大的组织和时间管理能力。
- 对质量的承诺和对细节的关注。
- 能够独立和协作工作。
- 愿意学习新工具和技术。
- 符合可靠性安全状态的资格;在加拿大居住至少五年。
- 具备在多元文化或多语言环境中工作的经验。
- 熟悉敏捷或其他现代项目管理方法。
- 具有远程或混合工作环境的经验。