数据科学家(机器学习)(IT)

多伦多 5天前全职 网络
40.6万 - 65.9万 / 年
数据科学家 该职位为混合模式,要求您每周至少4天在客户办公室工作 - 随时可能更改。 我们正在寻找一位具有实际经验的AI/ML工程师,能够构建和部署生产级模型,包括生成式AI解决方案。您将设计、训练、评估和运营现代云数据平台上的模型,实施强大的MLOps/LLMOps实践,并与数据、平台和产品团队合作推动端到端交付。 设计、训练、微调和评估ML和GenAI模型(监督/无监督,NLP,CV和基于LLM的用例)。 模型部署:使用容器和CI/CD将模型打包并部署到生产环境;使用REST/gRPC、批处理和流处理管道实现可扩展的服务。建立自动化训练、评估、模型注册、特征存储集成、监控(数据漂移、模型漂移、延迟、成本)和安全回滚。构建提示、检索管道(RAG)和模型适配器/LoRA;数据工程协作:与数据工程合作进行模式设计、数据合同和数据沿袭。在AWS和/或Snowflake上进行存储、计算、编排和治理;优化成本/性能。通过日志记录、跟踪、指标和警报对模型和数据管道进行检测;遵循安全、隐私和负责任的AI指南。AI/ML:精通Python和常见的ML技术栈;擅长使用TensorFlow和/或PyTorch进行训练、微调和推理。 生成式AI:具有LLM或扩散模型的经验;提示工程、RAG、评估框架和安全/防护技术。熟练使用CI/CD进行ML(例如,GitHub Actions/GitLab CI)、模型打包(Docker)、模型注册表、特征存储和监控。云数据平台:具有AWS的实际经验(例如,数据管道:构建和操作ETL/ELT;模式管理和数据质量检查。协作:能够与跨职能团队(数据工程、平台、产品、安全)合作并清晰地沟通权衡。向量/RAG:具有向量数据库的经验(例如,Kubernetes(EKS)用于模型服务和自动扩展。 测试:数据/模型管道的单元/集成测试;安全与合规:秘密管理、IAM、PII处理和负责任的AI实践。Snowpark ML、外部函数、用于数据库内ML的UDF。语言/框架:Python、TensorFlow、PyTorch、scikit-learn、Transformers。 云/数据:AWS(S3、ECR/ECS/EKS、SageMaker)、Snowflake(Snowpark)、SQL管道与编排:具有定义的SLA/SLO的生产化ML/GenAI服务可追溯实验沿袭的自动化训练和部署管道可靠的数据和模型监控(质量、漂移、性能、成本)该范围的确定包括技能水平、地理市场、经验和培训、许可证和认证等因素。在CGI,我们重视多样性带来的力量,并致力于营造一个人人归属的工作场所。我们与客户合作,建设更具包容性的社区,并赋予所有CGI合作伙伴蓬勃发展的能力。加入我们的团队——全球最大的IT和商业咨询服务公司之一。