高级AI工程师(LLMs,生成式AI)| 首席AI工程师
职位描述:
我们正在寻找一位专注于大型语言模型(LLMs)的高级AI工程师,负责从发现到生产的端到端AI项目。您将负责技术方向,与产品和利益相关者合作,构建可扩展的LLM解决方案(RAG、代理、微调、评估和部署)。此角色结合了动手工程、技术领导和团队指导。
职责:
· 领导LLM项目的端到端工作:问题框架、解决方案设计、实施、推出和迭代。
· 设计和交付LLM系统:检索增强生成(RAG)、工具或功能调用、代理工作流、提示策略和防护措施。
· 构建生产就绪的服务(API、工作者、编排)用于模型推理和LLM应用。
· 负责架构决策:数据流、向量存储、缓存、延迟和成本权衡,以及可靠性。
· 创建评估策略:基准测试、人类审查循环、回归测试和监控。
· 提高安全性和质量:减少幻觉、基础和引用、政策过滤和PII处理。
· 指导工程师,设定编码标准,审查PR,提高整体团队执行力。
· 与利益相关者清晰沟通:时间表、风险、权衡和可衡量的结果。
必需资格(5年以上):
· 5年以上软件工程、机器学习工程或应用AI经验,并有成熟的生产交付记录。
· 强大的Python技能和构建后端服务的经验(FastAPI或Flask,异步作业,队列)。
· 对LLM概念有扎实理解:令牌限制、上下文窗口、提示模式、工具调用、检索和提示工程。
· 至少有以下之一的实际经验:RAG(向量数据库)、微调或代理和编排(LangGraph、LangChain、LlamaIndex)。
· 具备MLOps基础知识:CI或CD、监控、日志记录、版本控制和可重复性。
· 强大的系统设计技能,涵盖延迟、成本、扩展和安全性。
· 能够领导项目,推动执行,并协调跨团队工作。
优先资格:
· 在OpenAI / Azure OpenAI上交付生产系统的经验(嵌入+聊天/功能调用),具有可靠性、提示/版本控制、评估、监控和支出管理的强大实践。
· 具有LLM评估和QA流程的经验。
· 具有云平台(AWS、Azure或GCP)、Docker和Kubernetes的经验。
· 在相关情况下构建多语言解决方案(阿拉伯语和英语)的经验。
· 构建企业或政府用例的咨询/顾问式AI助手的经验,包括防护措施、基础和人类参与的工作流。
技术栈:
· Python、FastAPI、OpenAI API、用于聊天历史/元数据的数据库(PostgreSQL),以及用于检索的向量存储(pgvector或托管向量数据库)
· 向量存储:pgvector、Pinecone、Weaviate、Chroma或FAISS
· 编排:LangChain、LangGraph、LlamaIndex或自定义工作流
· 可观察性:LLM跟踪(Langfuse/LangSmith)加上应用监控/日志记录(OpenTelemetry、集中日志、仪表板)。
· 部署:Docker、Kubernetes、Terraform
· LLM提供商:OpenAI或Azure OpenAI。
附加技能(加分项):
· 熟悉React(基于Vite的项目),能够与前端团队有效合作并理解UI驱动的AI需求。
· 将AI服务集成到全栈应用中的经验,协调前端、后端和AI层之间的工作。
· 理解AI输出在用户界面中的消费方式,包括可用性、清晰度和交互流程。
· 在跨职能产品团队中工作,能够将业务和用户需求转化为AI驱动的解决方案的经验。