机器学习运维工程师
关于Thunes
Thunes是全球资金流动的智能高速公路。Thunes的专有直接全球网络允许会员在超过130个国家和80多种货币中实时付款。
Thunes的网络通过超过350种不同的支付方式直接连接到全球超过70亿个移动钱包和银行账户,如GCash、M-Pesa、Airtel、MTN、Orange、JazzCash、Easypaisa、支付宝、微信支付等。
Thunes直接全球网络的会员包括像Uber和Deliveroo这样的零工经济巨头,像Grab和微信这样的超级应用,MTOs、金融科技、PSPs和银行。Thunes的直接全球网络通过其全球覆盖、内部智能财务管理平台和堡垒合规基础设施而与众不同,确保网络会员在全球实时支付时获得无与伦比的速度、控制、可见性、保护和成本效率。
Thunes总部位于新加坡,在包括巴塞罗那、北京、迪拜、伦敦、马尼拉、内罗毕、巴黎、利雅得、旧金山、圣保罗和上海在内的12个地点设有办事处。欲了解更多信息,请访问:https://www.thunes.com/
职位背景
我们正在寻找一位高度驱动、流程痴迷且技术卓越的工程师,他对弥合数据科学、人工智能工程和生产基础设施之间的差距感到兴奋。
您需要将初创企业的思维方式与平台架构师的纪律结合起来,确保我们的生产“黄金路径”是自动化、安全和成本高效的。MLOps职能负责将我们的核心工作系统与我们的AI技术栈连接起来的基础设施。我们设计解决方案、自动化管道和监控栈,以确保我们的数据科学家和AI工程师能够快速交付而不破坏任何东西。
主要职责
- 架构和协调无缝的多云环境。使用Terraform管理AI技术栈和系统以及企业数据基础设施
- 设计和维护实施奖章架构(青铜/白银/黄金)的稳健DataOps管道。使用Airflow编排DAGs并确保数据质量/血统在到达模型之前
- 通过实施“4C”确保MLOps生命周期的卓越:CI(在GitLab中自动化代码检查/测试)、CD(安全的发布策略)、CT(自动化再训练触发器)和CM(持续监控漂移/延迟)
- 为ML和LLM系统倡导金融运营(成本和效率)。实施方法以防止冗余API调用,并为失控的GPU实例或令牌激增编写自动化“终止开关”
- 通过架构服务来保护平台,允许我们的团队从不同环境中安全访问不同资源,管理IAM身份中心以实现最低特权访问
- 参与评估可观察性工具以跟踪令牌使用、每个用户的错误率和其他措施
专业经验和资格
- 5年以上技术经验,具有在生产中交付ML管道的良好记录
- 多云流利:在主要云平台(如AWS、GCP)上架构解决方案的深厚专业知识。对云服务(如安全、网络、存储、AI)的强大操作掌握
- LLM可观察性和成本优化经验:具有使用自托管工具(如Langfuse、LangSmith、Phoenix)设置栈的经验。能够实施缓存策略(如Redis/Memcached)
- 认证:Google专业机器学习工程师或AWS认证机器学习-专业/DevOps工程师-专业认证
- 拥有计算机科学、工程或相关领域的学士学位
- 基础设施即代码(IaC)专家:精通IaC(如Terraform、OpenTofu)。具有为多环境设置(开发/暂存/生产)编写模块化、可重用代码的经验
- DataOps精通:在数据湖仓上实施奖章架构的证明。精通Apache Airflow(编写自定义操作符)、数据质量工具如dbt测试和数据治理工具(如OpenMetadata)
- CI/CD和自动化精通:高级配置GitLab CI(如Runners、Secrets Management)。具有CML(持续机器学习)经验者优先
- 容器化精通:精通Docker、Kubernetes和编排(如VM、K8s)
- 对成本管理和效率充满热情:您将效率视为双重任务,优化财务成本的同时最大化系统性能
听起来像你吗?立即申请!