职位名称:LLM工程师 - 新项目AI工程
地点:加州尔湾(现场)。周一至周四现场办公,周五远程办公。
必须是美国公民/绿卡持有者
薪酬:每小时75-95美元。这是一个为期两年的合同,之后将转为全职。
关于我们:我们的使命是开发创新的AI解决方案,以革新我们的劳动力。随着我们启动一个令人兴奋的新项目AI工程,我们正在寻找一位出色的LLM工程师加入我们的团队,领导机器学习模型的开发,作为这一开创性项目的一部分。
职位描述:
我们正在寻找一位经验丰富的生成式AI/LLM工程师,负责领导由大型语言模型(LLM)驱动的应用程序的开发和部署。您将设计和实现生成式AI系统,包括智能聊天机器人、代理AI框架、RAG管道和多模态体验,利用NLP和基于变压器的架构的最新进展。
主要职责
• LLM应用设计与开发
• 为RAG、嵌入、提示调优和链式思维推理构建自定义管道
• 使用OpenAI的Agents SDK或LangChain等框架设计代理工作流
• 提示工程与评估
• 为各种任务设计稳健的提示,并使用少样本/提示链技术
• 通过自动化和人工反馈循环评估LLM输出的质量、安全性和延迟
• 模型集成与扩展
• 将LLM与内部系统、API、关系数据库、NoSQL数据库、向量数据库和实时推理堆栈集成
• 使用云原生工具(如OpenAI、Azure OpenAI、AWS SageMaker或Google Vertex AI)确保可扩展和高效的部署
• 创新与研究
• 探索和实现多模态AI集成(文本、图像、语音)
• 关注LLM的进展、开源模型基准和学术研究
• 协作与DevOps
• 与工程团队(前端、后端和数据)、设计师和产品负责人合作,定义用例和成功标准
• 编写干净、可测试的代码,参与架构评审和敏捷仪式
资格与技能
• 1-3年开发生成式AI解决方案的经验,涉及NLP、聊天机器人开发或内容生成(文本或图像)
• 3-5年AI或机器学习工程的实际操作经验
• 深刻理解变压器架构、注意力机制和标记化
• 有将基于LLM的解决方案部署到生产环境并使用API(OpenAI、Anthropic、Cohere等)的经验
• 精通Python,了解Hugging Face Transformers、LangChain或OpenLLM等工具
• 拥有使用向量数据库(Pinecone、Weaviate、FAISS)管理和查询嵌入的实际经验
• 对提示工程、RAG、代理框架和功能工具在将LLM与外部API和数据源集成方面有深入理解
• 熟悉分布式计算、GPU加速和推理优化
• 计算机科学、工程或相关领域的学士学位
优先资格(加分项)
• 计算机科学、工程或相关领域的硕士或博士学位
• 具有多模态AI系统(例如,结合文本、图像、语音)的经验
• 了解负责任的AI实践和生成式AI的安全对齐
• 熟悉开源LLM(Mistral、Mixtral、Falcon、LLaMA)
• 理解模型上下文协议(MCP)及其在LLM生态系统中的集成
• 具有对话设计、对话管理和人机协作工作流的背景