数据科学家该职位为混合模式，要求您每周至少在客户办公室工作4天 - 随时可能会有变动。我们正在寻找一位具有实际经验的AI/ML工程师，能够构建和部署生产级模型，包括生成式AI解决方案。您将设计、训练、评估并在现代云数据平台上运营模型，实施稳健的MLOps/LLMOps实践，并与数据、平台和产品团队合作，推动端到端的交付。设计、训练、微调和评估ML和GenAI模型（监督/无监督，NLP，CV和基于LLM的用例）。 • 模型部署：使用容器和CI/CD将模型打包并部署到生产环境；通过REST/gRPC、批处理和流式管道实现可扩展的服务。 • 建立自动化训练、评估、模型注册、特征存储集成、监控（数据漂移、模型漂移、延迟、成本）和安全回滚。 • 构建提示、检索管道（RAG）和模型适配器/LoRA；数据工程协作：与数据工程合作进行模式设计、数据合同和数据血缘。 • 在AWS和/或Snowflake上进行存储、计算、编排和治理；优化成本/性能。 • 使用日志、跟踪、指标和警报对模型和数据管道进行检测；遵循安全、隐私和负责任的AI指南。 AI/ML：精通Python和常见的ML技术栈；擅长使用TensorFlow和/或PyTorch进行训练、微调和推理。 • 生成式AI：具有LLM或扩散模型的经验；提示工程、RAG、评估框架和安全/防护技术。 • 熟练使用CI/CD进行ML（例如，GitHub Actions/GitLab CI）、模型打包（Docker）、模型注册、特征存储和监控。 • 云数据平台：具有AWS的实际经验（例如，数据管道：构建和操作ETL/ELT；模式管理和数据质量检查。 • 协作：能够与跨职能团队（数据工程、平台、产品、安全）合作，并清晰地沟通权衡。向量/RAG：具有向量数据库的经验（例如，Kubernetes (EKS)用于模型服务和自动扩展。 • 测试：数据/模型管道的单元/集成测试；安全与合规：秘密管理、IAM、PII处理和负责任的AI实践。 • Snowpark ML，外部函数，UDF用于数据库内ML。语言/框架：Python, TensorFlow, PyTorch, scikit-learn, Transformers • 云/数据：AWS (S3, ECR/ECS/EKS, SageMaker), Snowflake (Snowpark), SQL • 管道与编排：具有定义的SLA/SLO的生产化ML/GenAI服务 • 具有可追溯实验血缘的自动化训练和部署管道 • 可靠的数据和模型监控（质量、漂移、性能、成本） • 此范围的确定包括技能水平、地理市场、经验和培训、执照和认证等因素。在CGI，我们重视多样性带来的力量，并致力于营造一个每个人都属于的工作场所。我们与客户合作，建设更具包容性的社区，并赋能所有CGI合作伙伴蓬勃发展。欢迎加入我们的团队——全球最大的信息技术和商业咨询服务公司之一。

数据科学家（机器学习）（IT）

confidential