角色概述 Stellar Technologies正在寻找一名机器学习工程师（GenAI），负责设计、构建和部署结合大型语言模型（LLMs）、检索增强生成（RAG）和代理AI框架的下一代AI系统。在此角色中，您将连接模型开发和生产工程——开发可扩展的AI管道，集成实时API，并确保高性能AI服务以支持企业级解决方案。您将在机器学习、云基础设施和应用研究的交叉点工作，与顶尖工程师和数据科学家合作，提供智能、可投入生产的AI能力。主要职责 • 开发和优化利用LLMs、RAG和代理AI框架（LangChain, LangGraph）的AI系统。 • 构建和部署具有实时推理和检索组件的生产级ML管道。 • 设计和管理API和流服务，将AI模型集成到企业平台中。 • 使用Docker、Kubernetes和Azure ML实现容器化、编排的部署。 • 自动化数据预处理、模型训练、评估和版本控制管道。 • 与跨职能团队合作，将模型集成到前端、分析和自动化工作流程中。 • 确保已部署AI工作负载的治理、合规性和安全性。 • 进行性能基准测试，优化推理延迟和成本。 • 使用可观察性框架（日志记录、指标、跟踪）监控生产中的AI系统。 • 参与架构讨论，以增强AI服务的可扩展性和可靠性。必备技能和经验 • 拥有LLMs、RAG和代理框架（LangChain, LangGraph, Semantic Kernel等）的丰富实践经验。 • 精通Python，深入了解ML库如PyTorch、TensorFlow、scikit-learn、Hugging Face Transformers。 • 在API和微服务工程（FastAPI, Flask）方面有扎实经验。 • 熟悉流架构和实时数据处理。 • 了解云平台（优选Azure），包括Azure AI、Cognitive Services和ML Ops。 • 具有容器化和编排（Docker, Kubernetes）经验。 • 理解向量数据库（Pinecone, Weaviate, FAISS）和检索机制。 • 在CI/CD、模型部署和生产监控方面有经验。优先技能 • 接触过基于GPU的推理优化和无服务器部署。 • 了解AI的可观察性和监控工具（Prometheus, Grafana, Azure Monitor）。 • 具备模型微调、提示工程或代理编排经验。 • 理解AI治理、伦理AI和数据隐私框架。软技能 • 强大的分析和解决问题的思维。 • 出色的合作和沟通能力。 • 对创新、实验和应用AI充满热情。

机器学习工程师 – 生成式人工智能（大型语言模型 / 检索增强生成 / 代理人工智能）

Stellar Technologies