高级软件工程师;后端 → 人工智能 - 远程

新加坡 2个月前全职 网络
44.3万 - 55.4万 / 年
职位:高级软件工程师(后端 → 人工智能应用) - 远程,全球 概述 你是那个人吗?负责并交付支持人工智能功能的后端系统。你将处理模糊的产品目标,设计可靠的服务,整合LLM/ML组件,并在最少监督下交付生产结果。你已经拥有强大的后端经验,并在LLM/ML方面有显著的提升(项目、代码库、论文或交付的功能),并且你对成为人工智能应用的首选工程师感到兴奋。 你将做什么 职责 • 设计和构建服务:为人工智能驱动的功能(身份验证、速率限制、重试、幂等性、运维手册)架构和实现生产API、工作程序和数据流。 • LLM/ML集成:使用模型API和开源模型交付功能;实现工具/函数调用、结构化输出、流式处理和健壮的错误处理。 • 检索与数据:搭建RAG管道(分块、嵌入、向量存储)、质量检查和新鲜度/一致性工作流程。 • 评估、可靠性与安全性:添加离线/在线评估、保护措施、红队测试钩子和可观察性(跟踪、令牌/延迟指标、提示/版本跟踪)。 • 性能与成本:分析延迟、内存和令牌使用;添加缓存、批处理和后备方案;保持成本/SLA在目标范围内。 • MLOps基础:在需要的地方进行容器化/模型服务(例如,vLLM/Triton),管理模型/配置/版本,自动化CI/CD。 • 责任:全程领导项目,撰写清晰的文档、RFC和明确的利益相关者更新;指导同事并提高工程标准。 资格 • 证明的高级后端经验(通常4-8年在规模上交付服务)。 • 精通以下之一:Python或TypeScript/Node;并且熟悉一种系统语言(Go/Java/C++是加分项)。 • 扎实的分布式系统基础知识:并发、队列/流、重试、退避、一致性权衡。 • 数据存储:SQL(Postgres/MySQL)、缓存(Redis),对向量数据库(例如,pgvector/FAISS/Pinecone)感到舒适或愿意快速学习。 • 云与开发体验:Docker/Kubernetes,AWS/GCP/Azure,CI/CD,基础设施即代码(Terraform),以及生产监控(Open Telemetry/Prometheus/Grafana)。 • 证明的LLM/ML学习:交付功能或使用OpenAI/Anthropic/Mistral或开源模型的严肃副项目;熟悉Lang Chain/Lang Graph/Llama Index(或同等),嵌入和RAG。 • 产品直觉和自主性:你将模糊目标转化为小的、可测试的增量,并清晰地沟通权衡。 优先考虑的条件 • 有评估框架、提示/程序设计、JSON模式/结构化输出和多代理编排的经验。 • 模型定制的熟悉度(LoRA/微调/蒸馏)及何时不进行训练;数据集策划的基础知识。 • 模型服务与性能:vLLM、张量/kv缓存调整、批处理、量化。 • 安全与合规:个人身份信息处理、GDPR、数据治理。 • 对区块链系统/Web3的兴趣(一些客户是机构和区块链公司)。 • 开源贡献、技术写作或人工智能功能的公开演示。 成功指标 • 交付:按时将功能交付到生产,并有明确的发布和回滚计划。 • 可靠性:满足P95延迟和错误预算;评估通过率和回归警报到位。 • 质量与成本:在目标KPI(例如,解决率)上有显著提升,请求成本在预算范围内。 • 责任:高质量的文档/运维手册;同事采用你的模式。 前90天(示例) • 30天:交付一个范围明确的人工智能功能(例如,RAG支持的端点),具备日志记录、跟踪和基本评估。 • 60天:增强可靠性(保护措施、后备方案),添加缓存/批处理,降低成本/延迟约20-30%。 • 90天:领导第二个项目(例如,多工具代理或微调评估),发布内部RFC + 运维手册。 我们提供的福利 • 灵活的工作选项:以远程为主的文化,可以在任何地方工作。 • 全球多元化的员工:你将与来自不同背景和文化的人一起工作。 • 学习与发展:你将参与创新和具有挑战性的项目,并有机会接触专家和导师以提升你的技能。 • 职业成长:获得培训、指导和参与开源项目的机会。 • 全球活动与会议:参加行业活动的机会。 • 协作与创新文化:我们鼓励团队合作和新想法。 我们对多样性的承诺 在Nethermind,我们庆祝多样性,并致力于为所有团队成员创造包容的环境。我们相信多样的观点推动创新,并为区块链社区带来更好的解决方案。 准备加入我们吗? 如果你对区块链充满热情并渴望产生影响,我们期待听到你的消息。点击申请此职位,开始你与Nethermind的旅程。