人工智能 / 机器学习工程师

16天前全职19次浏览
48.2万 - 72.3万 / 年 monoya

monoya

location 东京
unsaved
我们的市场生死攸关于其智能化程度:闪电般快速的语义搜索、多语言聊天能够真正理解上下文、以及基于数据的推荐帮助买家与日本制造商达成交易。您将成为将这些想法转化为生产现实的工程师——负责从快速原型到经过实战检验、可扩展的推理服务的一切工作。 技术栈 LLM / 代理:OpenAI,Ollama(本地 LLM),LangChain 检索:Firestore + 向量数据库,云存储 服务:Python FastAPI,Cloud Run,Docker/Podman CI/CD:GitHub Actions,Terraform(即将上线) 监控:Cloud Logging,Prometheus,OpenTelemetry 职责 • LLM 驱动的代理——设计和部署多模态、工具使用的代理,能够分类查询、提出澄清问题,并起草估算(RAG 管道、函数调用等)。 • 向量搜索与知识图谱——在 Firestore + Weaviate 上构建和调整语义搜索,探索有用的图形表示。 • 模型评估——建立可重复的基准、离线/在线指标和自动回归,以便我们知道何时新的提示或微调确实更好。 • 原型制作 → 生产——在笔记本中制作概念验证(PoC),然后将成功的项目转化为在 Cloud Run 上运行的干净、经过测试的服务(Python FastAPI,偶尔使用 Go/Rust 辅助工具)。 • 合作——与产品和设计紧密配合,端到端交付功能。 要求 • 具有 2-3 年构建机器学习或数据密集型系统的经验(行业经验或高级研究生工作)。 • 编写干净的 Python 代码,并至少精通一个深度学习框架(优先考虑 PyTorch;JAX/TensorFlow 也欢迎)。 • 理解数学知识,能够在模型或检索步骤出现问题时进行调试。 • 使用现代 LLM 工具(OpenAI,Ollama,vLLM,Hugging Face,LangChain,LiteLLM 等)发布过项目,或者可以展示一个密集的侧项目。 • 喜欢向非机器学习团队解释权衡。 • 喜欢成为首位专职机器学习员工,并从零开始建立最佳实践。 附加条件 虽然不是特别要求,但如果您具备以下任何条件,请告诉我们。 • 日语能力 • 熟悉 Google Cloud AI 技术栈(Vertex AI,TPUs,Cloud Functions,BigQuery)。 • 有微调或提炼语言模型的经验,特别是在多语言任务(JA-EN)方面。 • 向量数据库操作(Weaviate)和评估工具。 • 我们可以阅读的博客文章或开源贡献。 • 熟悉 Go 或 Rust 进行高性能数据处理。