角色概述
Stellar Technologies 正在寻找一位机器学习工程师(GenAI),负责设计、构建和部署结合大型语言模型(LLMs)、检索增强生成(RAG)和自主 AI 框架的下一代 AI 系统。
在这个角色中,您将连接模型开发和生产工程 - 开发可扩展的 AI 管道,集成实时 API,并确保高性能的 AI 服务,支持企业级解决方案。您将工作于机器学习、云基础设施和应用研究的交汇点,与顶尖工程师和数据科学家合作,提供智能、可投入生产的 AI 能力。
主要职责
利用 LLMs、RAG 和自主 AI 框架(LangChain、LangGraph)开发和优化 AI 系统。
构建和部署具有实时推理和检索组件的生产级 ML 管道。
设计和管理 API 和流服务,将 AI 模型集成到企业平台中。
使用 Docker、Kubernetes 和 Azure ML 实现容器化、编排的部署。
自动化数据预处理、模型训练、评估和版本控制管道。
与跨职能团队合作,将模型集成到前端、分析和自动化工作流程中。
确保已部署 AI 工作负载的治理、合规性和安全性。
进行性能基准测试,优化推理延迟和成本。
使用可观察性框架(日志记录、指标、跟踪)监控生产中的 AI 系统。
参与架构讨论,以增强 AI 服务的可扩展性和可靠性。
所需技能和经验
对 LLMs、RAG 和自主框架(LangChain、LangGraph、Semantic Kernel 等)具有强大的实践经验。
精通 Python,深入理解 ML 库,如 PyTorch、TensorFlow、scikit-learn、Hugging Face Transformers。
在 API 和微服务工程(FastAPI、Flask)方面有扎实的经验。
熟悉流式架构和实时数据处理。
了解云平台(优先考虑 Azure),包括 Azure AI、认知服务和 ML Ops。
具有容器化和编排(Docker、Kubernetes)的经验。
理解向量数据库(Pinecone、Weaviate、FAISS)和检索机制。
在 CI/CD、模型部署和生产监控方面有经验。
优先技能
接触基于 GPU 的推理优化和无服务器部署。
了解 AI 的可观察性和监控工具(Prometheus、Grafana、Azure Monitor)。
有模型微调、提示工程或自主编排的经验。
理解 AI 治理、伦理 AI 和数据隐私框架。
软技能
强大的分析和解决问题的思维方式。
优秀的协作和沟通能力。
对创新、实验和应用 AI 的热情。