数据科学家

渥太华 26天前全职 网络
面议
富士通加拿大正在招聘一名全职、永久的数据科学家,以支持企业级知识管理(KM)现代化项目。该职位专注于AI/ML/NLP开发、语义增强和混合环境中的数据转换,助力交付智能、可扩展的KM解决方案。 主要技能: - 数据科学、人工智能、机器学习或计算语言学硕士学位。 - 精通Python及其库,如TensorFlow、PyTorch、Scikit-learn、Hugging Face Transformers、Pandas和lxml。 - 具备监督学习、无监督学习和强化学习模型的经验。 - 擅长NLP技术,包括分词、实体识别、主题建模和语义搜索。 - 具备知识图谱和语义增强的经验。 - 深刻理解XML结构、命名空间和DOM操作。 - 具备关系数据库(PostgreSQL、Oracle、SQL Server)和规范化模式设计的经验。 - 熟悉Git进行版本控制和协作。 - 具备Azure认知服务和DevOps管道的经验。 - 在受监管或公共部门环境中的经验。 职责: - 设计和实施用于语义搜索、矛盾检测和内容重写的AI/ML模型。 - 使用RDF、SPARQL和本体设计构建和查询知识图谱。 - 开发和优化用于XML转换的XSLT样式表和XPath表达式。 - 使用DITA XML和文档即代码原则编写和管理结构化内容。 - 使用Python和Talend或Apache NiFi等工具设计和执行ETL工作流程。 - 进行数据沿袭和元数据管理,以确保可追溯性和完整性。 - 与跨职能团队合作,包括架构师、语言学家和内容作者。 - 支持迭代开发周期、快速原型设计和持续集成。 - 将AI框架与SharePoint Online、Microsoft 365和工作流自动化工具集成。 必备技能: - 数据科学、人工智能、机器学习或计算语言学硕士学位。 - 精通Python及其库,如TensorFlow、PyTorch、Scikit-learn、Hugging Face Transformers、Pandas和lxml。 - 具备监督学习、无监督学习和强化学习模型的经验。 - 擅长NLP技术,包括分词、实体识别、主题建模和语义搜索。 - 具备知识图谱和语义增强的经验。 - 深刻理解XML结构、命名空间和DOM操作。 - 具备关系数据库(PostgreSQL、Oracle、SQL Server)和规范化模式设计的经验。 - 熟悉Git进行版本控制和协作。 - 具备Azure认知服务和DevOps管道的经验。 - 在受监管或公共部门环境中的经验。 加分技能: - 熟悉LLMs(如GPT-4、Claude)用于内容生成和总结。 - 具备FAISS或Pinecone进行语义聚类的经验。 - 接触过FrameNet和其他语言资源以进行语义理解。 - 具备Shell脚本、Typescript、Scala或R的经验。 - 使用Power BI、Tableau或Quicksight进行迁移后分析。 - 理解偏见缓解、可解释性和负责任的AI实践。 - 具备矛盾检测和语义验证的经验。 - 熟悉用于检索增强生成(RAG)的文档分块。 一般要求: - 必须居住在魁北克的加蒂诺地区。 - 混合工作安排 - 每周至少三天现场工作,视需要增加额外天数。 - 强大的组织和时间管理能力。 - 对质量的承诺和对细节的关注。 - 能够独立和协作工作。 - 愿意学习新工具和技术。 - 符合可靠性安全状态的资格;在加拿大居住至少五年。 - 具备在多元文化或多语言环境中工作的经验。 - 熟悉敏捷或其他现代项目管理方法。 - 具有远程或混合工作环境的经验。