在Codvo,软件和人员转型是齐头并进的。我们是一家全球同理心驱动的技术服务公司,产品创新和成熟的软件工程是我们核心DNA的一部分。我们的核心价值观——尊重、公平、成长、敏捷和包容——指导着我们所做的一切。我们不断扩展在数字战略、设计、架构和产品管理方面的专业知识,以提供可衡量的结果和创新思维。
关于该职位
我们正在寻找一位经验丰富的高级AI工程师,他对石油和天然气、制造业或公用事业等资产密集型行业有深刻理解,以领导我们生成式AI应用的强大且可扩展的管道和后端系统的设计、开发和实施。在这个角色中,您将负责协调数据流,集成AI服务,开发RAG管道,与LLM合作,并确保支持我们生成式AI解决方案的后端基础设施的顺利运行。
您还需要应用现代LLMOps实践,处理模式约束生成,优化成本和延迟权衡,减轻幻觉,并确保GenAI系统的安全性、个性化和可观察性。
职责
生成式AI管道开发
- 设计和实施可扩展和模块化的管道,以跨GenAI工作负载进行数据摄取、转换和编排。
- 管理LLM、嵌入服务、向量存储、SQL源和API之间的数据和模型流。
- 构建集成提示回归测试和版本控制的CI/CD管道。
- 使用LangChain或LangGraph等编排框架进行工具路由和多跳工作流。
- 使用Langfuse或Prometheus等工具监控系统性能。
数据和文档摄取
- 开发系统以摄取非结构化(PDF、OCR)和结构化(SQL、API)数据。
- 应用文本、图像和代码的预处理管道。
- 确保跨源的数据完整性、格式一致性和安全性。
AI服务集成
- 集成外部和内部LLM API(OpenAI、Claude、Mistral、Qwen等)。
- 构建内部API以实现顺畅的后端-AI通信。
- 通过基于延迟或成本预算的回退路由优化性能。
- 使用模式约束提示和输出过滤器抑制幻觉并保持事实准确性。
检索增强生成(RAG)管道
- 使用向量相似性(FAISS/Qdrant)和结构化数据(SQL/API)构建混合RAG管道。
- 为多模态或多源文档设计自定义检索策略。
- 使用DPO或基于反馈的技术应用检索后排名。
- 通过重新排名、块合并和评分逻辑提高上下文相关性。
LLM集成和优化
- 管理提示工程、模型交互和调优工作流。
- 实施LLMOps最佳实践:提示版本控制、输出验证、缓存(KV存储)和回退设计。
- 使用温度调优、令牌限制和推测解码优化生成。
- 将可观察性和成本监控集成到LLM工作流中。
后端服务所有权
- 设计和维护支持GenAI应用的可扩展后端服务。
- 实施监控、日志记录和性能跟踪。
- 构建RBAC(基于角色的访问控制)和多租户个性化。
- 支持生产的容器化(Docker、Kubernetes)和自动扩展基础设施。
所需技能和资格
教育
- 计算机科学、人工智能、机器学习或相关领域的学士或硕士学位。
经验
- 在AI/ML工程中有5年以上的经验,具有端到端管道开发经验。
- 在生产中构建和部署LLM/RAG系统的实践经验。
- 在公共云平台(AWS、Azure或GCP)上有丰富经验。
- 在资产密集型行业(如石油和天然气、公用事业、制造业)有2年以上的经验。
技术技能
- 精通Python和诸如Transformers、SentenceTransformers、PyTorch等库。
- 对GenAI基础设施、LLM API和LangChain/LangGraph等工具链有深刻理解。
- 具有使用Git进行RESTful API开发和版本控制的经验。
- 了解向量数据库(Qdrant、FAISS、Weaviate)和基于相似性的检索。
- 熟悉Docker、Kubernetes和可扩展微服务设计。
- 具有使用Prometheus、Grafana或Langfuse等可观察性工具的经验。
生成式AI特定技能
- 了解LLM、VAE、扩散模型、GAN。
- 具有构建结构化+非结构化RAG管道的经验。
- 具有安全控制、模式执行和幻觉缓解的提示工程经验。
- 具有提示测试、缓存策略、输出过滤和回退逻辑的经验。
- 熟悉DPO、RLHF或其他基于反馈的微调方法。
软技能
- 强大的分析、问题解决和调试技能。
- 与跨职能团队(产品、QA和DevOps)出色的协作能力。
- 能够在快节奏、敏捷的环境中工作并交付生产级解决方案。
- 清晰的沟通和强大的文档编写实践。
优先资格
- 具有OCR、文档解析和布局感知分块的经验。
- 熟悉用于生成式AI的MLOps和LLMOps工具。
- 对开源GenAI或AI基础设施项目的贡献。
- 了解GenAI治理、道德部署和使用控制。
- 具有使用Guardrails.ai、Rebuff或Constitutional AI等幻觉抑制框架的经验。