项目描述:
该项目的主要目标是为一家大型美国零售公司现代化、维护和开发电子商务平台,每周为数百万全渠道客户提供服务。
解决方案由几个专注于不同领域的产品团队提供 - 客户、忠诚度、搜索和浏览、数据集成、购物车。
当前的首要任务是新品牌的入驻、架构重组、数据库迁移、微服务迁移到统一的云原生解决方案,同时不对业务造成任何干扰。
职责:
我们正在寻找一位具有机器学习专业知识和对搜索引擎有良好理解的经验丰富的数据工程师,负责以下工作:
- 设计、开发和优化利用Lucene/Solr和现代嵌入的语义和基于向量的搜索解决方案。
- 应用机器学习、深度学习和自然语言处理技术来提高搜索相关性和排名。
- 开发用于索引、检索和模型推理的可扩展数据管道和API。
- 将机器学习模型和搜索功能集成到生产系统中。
- 评估、微调和监控搜索性能指标。
- 与软件工程师、数据工程师和产品团队合作,将业务需求转化为技术实现。
- 及时了解搜索技术、LLM和语义检索框架的最新进展。
必备技能描述:
- 在数据科学或机器学习工程领域有5年以上经验,专注于信息检索或语义搜索。
- 在Java和Python编程方面有丰富经验(生产级代码,而不仅仅是原型设计)。
- 深入了解Lucene、Apache Solr或Elasticsearch(索引、查询调优、分析器、评分模型)。
- 具有向量数据库、嵌入和语义搜索技术的经验。
- 对NLP技术有深入理解(分词、嵌入、转换器等)。
- 在生产中部署和维护机器学习/搜索系统的经验。
- 对软件工程最佳实践有扎实理解(CI/CD、测试、版本控制、代码审查)。
加分技能描述:
- 在分布式团队中与美国客户合作的经验。
- 具有LLM、RAG管道和向量检索框架的经验。
- 了解Spring Boot、FastAPI或类似的后端框架。
- 熟悉Kubernetes、Docker和云平台(AWS/Azure/GCP)。
- 具有MLOps和模型监控工具的经验。
- 对开源搜索或机器学习项目的贡献。