数据科学家(机器学习)(IT)

多伦多 5天前全职 网络
40.6万 - 65.9万 / 年
数据科学家 该职位为混合模式,要求您每周至少在客户办公室工作4天 - 随时可能会有变动。 我们正在寻找一位具有实际经验的AI/ML工程师,能够构建和部署生产级模型,包括生成式AI解决方案。您将设计、训练、评估并在现代云数据平台上运营模型,实施稳健的MLOps/LLMOps实践,并与数据、平台和产品团队合作,推动端到端的交付。 设计、训练、微调和评估ML和GenAI模型(监督/无监督,NLP,CV和基于LLM的用例)。 • 模型部署:使用容器和CI/CD将模型打包并部署到生产环境;通过REST/gRPC、批处理和流式管道实现可扩展的服务。 • 建立自动化训练、评估、模型注册、特征存储集成、监控(数据漂移、模型漂移、延迟、成本)和安全回滚。 • 构建提示、检索管道(RAG)和模型适配器/LoRA;数据工程协作:与数据工程合作进行模式设计、数据合同和数据血缘。 • 在AWS和/或Snowflake上进行存储、计算、编排和治理;优化成本/性能。 • 使用日志、跟踪、指标和警报对模型和数据管道进行检测;遵循安全、隐私和负责任的AI指南。 AI/ML:精通Python和常见的ML技术栈;擅长使用TensorFlow和/或PyTorch进行训练、微调和推理。 • 生成式AI:具有LLM或扩散模型的经验;提示工程、RAG、评估框架和安全/防护技术。 • 熟练使用CI/CD进行ML(例如,GitHub Actions/GitLab CI)、模型打包(Docker)、模型注册、特征存储和监控。 • 云数据平台:具有AWS的实际经验(例如,数据管道:构建和操作ETL/ELT;模式管理和数据质量检查。 • 协作:能够与跨职能团队(数据工程、平台、产品、安全)合作,并清晰地沟通权衡。 向量/RAG:具有向量数据库的经验(例如,Kubernetes (EKS)用于模型服务和自动扩展。 • 测试:数据/模型管道的单元/集成测试;安全与合规:秘密管理、IAM、PII处理和负责任的AI实践。 • Snowpark ML,外部函数,UDF用于数据库内ML。 语言/框架:Python, TensorFlow, PyTorch, scikit-learn, Transformers • 云/数据:AWS (S3, ECR/ECS/EKS, SageMaker), Snowflake (Snowpark), SQL • 管道与编排:具有定义的SLA/SLO的生产化ML/GenAI服务 • 具有可追溯实验血缘的自动化训练和部署管道 • 可靠的数据和模型监控(质量、漂移、性能、成本) • 此范围的确定包括技能水平、地理市场、经验和培训、执照和认证等因素。在CGI,我们重视多样性带来的力量,并致力于营造一个每个人都属于的工作场所。我们与客户合作,建设更具包容性的社区,并赋能所有CGI合作伙伴蓬勃发展。欢迎加入我们的团队——全球最大的信息技术和商业咨询服务公司之一。