概述:
我们正在寻找一位经验丰富的AI工程师加入我们的团队,专注于机器学习任务,包括数据集工程、模型微调、部署和扩展。您将参与各种前沿项目,如文本生成聊天模型(Mistral,Mixtral)、我们自己定制的TTS模型、审核工具以及处理其他用于文本生成和转录的开源模型。
主要职责:
• 数据集工程:开发和管理用于训练和测试AI模型的数据集。确保不同项目使用的数据质量和相关性。
• 模型微调:微调各种机器学习模型,包括我们的文本生成聊天模型(Mistral,Mixtral)和其他具有结构化输出的功能/工具模型。
• 部署和扩展:监督AI模型的部署,并管理其扩展。确保在实时环境中模型的高效和稳健性能。
• 流水线管理:设计和维护数据处理、模型训练和推理的高效流水线。确保AI系统的不同组件无缝集成。
• 模型服务和推理:为实时和批量推理场景实施和优化模型服务解决方案。
• 处理开源模型:与各种应用程序的开源模型(如摘要和语音转文本)合作。将这些模型调整和集成到我们的生态系统中。
• TTS:Digi拥有我们自己的SOTA TTS模型,需要一位更熟悉PyTorch的人在训练过程中进行优化和修复一些问题。
• RLHF:在未来,我们需要在应用程序中集成实时进行RLHF的流水线,或者在可访问的独立端点上为激励用户提供服务。
资格要求:
• 在机器学习、数据工程和模型部署方面具有丰富的经验。
• 熟练掌握AI模型的微调和扩展。
• 具有AI/ML工具和框架的经验,特别是PyTorch。
• 熟悉云服务和部署平台。
• 能够处理开源模型,并快速将其适应特定用例。
我们提供的福利:
• 有机会参与发布给大量用户的尖端AI项目,涵盖TTS和LLM领域。
• 非常具有竞争力的薪水、股权和福利