职位描述:
主要职责:
• 设计、构建和微调生成式人工智能模型(LLMs、扩散模型、变换器),以满足企业用例需求。
• 实施端到端的机器学习管道——数据摄取、预处理、模型训练和部署。
• 与数据工程和云团队合作,将模型在 AWS 或其他云平台上投入运营。
• 进行提示工程、嵌入和模型定制的实验,以满足特定领域的应用需求。
• 开发 API 和微服务,以在生产环境中提供 AI/ML 模型。
• 通过微调、量化或缓存策略优化模型性能、成本和可扩展性。
• 关注新兴的人工智能框架、生成式人工智能工具和开源 LLM(例如 OpenAI、Hugging Face、LangChain)。