一家公司正在寻找软件工程师 L4 / L5,模型服务系统,机器学习平台。
主要职责
开发和扩展计算基础设施以支持人工智能需求并推动机器学习/人工智能创新
为机器学习应用程序(包括大型语言模型)构建可扩展且稳健的模型服务系统
与工程师、产品经理和数据科学家跨职能合作
所需资格
在构建用于在线机器学习模型推理的高流量分布式服务和基础设施方面有经验
理解用于生成模型和大型语言模型的可扩展模型服务解决方案
精通面向对象编程,最好是 Java
熟悉使用 Triton Inference Server 和 Docker 等工具部署机器学习模型
计算机科学、应用数学、工程或相关领域的学士/硕士学位