数据科学家
该职位为混合模式,要求您每周至少在客户办公室工作4天 - 随时可能会有变动。
我们正在寻找一位具有实际经验的AI/ML工程师,能够构建和部署生产级模型,包括生成式AI解决方案。您将设计、训练、评估并在现代云数据平台上运营模型,实施稳健的MLOps/LLMOps实践,并与数据、平台和产品团队合作,推动端到端的交付。
设计、训练、微调和评估ML和GenAI模型(监督/无监督,NLP,CV和基于LLM的用例)。
• 模型部署:使用容器和CI/CD将模型打包并部署到生产环境;通过REST/gRPC、批处理和流式管道实现可扩展的服务。
• 建立自动化训练、评估、模型注册、特征存储集成、监控(数据漂移、模型漂移、延迟、成本)和安全回滚。
• 构建提示、检索管道(RAG)和模型适配器/LoRA;数据工程协作:与数据工程合作进行模式设计、数据合同和数据血缘。
• 在AWS和/或Snowflake上进行存储、计算、编排和治理;优化成本/性能。
• 使用日志、跟踪、指标和警报对模型和数据管道进行检测;遵循安全、隐私和负责任的AI指南。
AI/ML:精通Python和常见的ML技术栈;擅长使用TensorFlow和/或PyTorch进行训练、微调和推理。
• 生成式AI:具有LLM或扩散模型的经验;提示工程、RAG、评估框架和安全/防护技术。
• 熟练使用CI/CD进行ML(例如,GitHub Actions/GitLab CI)、模型打包(Docker)、模型注册、特征存储和监控。
• 云数据平台:具有AWS的实际经验(例如,数据管道:构建和操作ETL/ELT;模式管理和数据质量检查。
• 协作:能够与跨职能团队(数据工程、平台、产品、安全)合作,并清晰地沟通权衡。
向量/RAG:具有向量数据库的经验(例如,Kubernetes (EKS)用于模型服务和自动扩展。
• 测试:数据/模型管道的单元/集成测试;安全与合规:秘密管理、IAM、PII处理和负责任的AI实践。
• Snowpark ML,外部函数,UDF用于数据库内ML。
语言/框架:Python, TensorFlow, PyTorch, scikit-learn, Transformers
• 云/数据:AWS (S3, ECR/ECS/EKS, SageMaker), Snowflake (Snowpark), SQL
• 管道与编排:具有定义的SLA/SLO的生产化ML/GenAI服务
• 具有可追溯实验血缘的自动化训练和部署管道
• 可靠的数据和模型监控(质量、漂移、性能、成本)
• 此范围的确定包括技能水平、地理市场、经验和培训、执照和认证等因素。在CGI,我们重视多样性带来的力量,并致力于营造一个每个人都属于的工作场所。我们与客户合作,建设更具包容性的社区,并赋能所有CGI合作伙伴蓬勃发展。欢迎加入我们的团队——全球最大的信息技术和商业咨询服务公司之一。