高级DevOps/ML Ops工程师

圣弗朗西斯科 12天前全职 网络
面议
我们正在寻找一位经验丰富且积极主动的领导者,来担任我们客户核心基础设施团队中的一个高可见度职位。此角色将领导跨DevOps、MLOps和安全/IT的各种关键任务,并在多个团队中承担跨职能职责。这是一个独特的机会,可以塑造支持我们模型的基础设施的方向,推动突破性发现,并加速与合作伙伴的现实应用。 您需要的资格: • 计算机科学、信息技术或相关领域的学士学位。 • 3年以上Kubernetes管理和开发经验。 • 在管理机器学习模型生命周期、模型服务和分布式训练方面的实际经验。 • 在自动化方面有成熟经验,并具备强大的系统工程技能。 • 对网络安全原则和最佳实践有扎实的理解。 • 强烈的责任感和责任心,能够处理紧急的操作问题,以确保团队的顺利发展和部署。 • MLOps专业知识:熟练掌握MLOps框架和工具,如ModelDB、Kubeflow、Pachyderm和数据版本控制(DVC)。 • 领域知识:对生物学或化学有基本了解;在制药或生物技术行业的经验是一个加分项。 • 软件工程背景:在软件工程方面有坚实的基础,并转向技术运营角色。 • 安全意识:能够识别安全风险并实施有效的缓解措施。 • 初创公司经验:在初创公司环境中有丰富经验,展示出适应能力和解决问题的能力。 • 生产支持:支持生产系统和机器学习管道的经验。 • 教育背景:计算机科学或相关技术领域的硕士/博士学位,或同等的实践经验。 • 领导能力:证明有能力领导和发展由3-5名或更多成员组成的工程团队。 您的工作内容: • 管理和维护基础设施,包括Kubernetes GPU资源调度、扩展、监控、日志记录和性能优化。 • 使用Kubeflow和Ray等工具开发和维护自动化机器学习管道。 • 管理和支持协作和生产力平台,包括Google Workspace、GitLab及相关的CI/CD集成。 • 实施并执行网络安全政策和最佳实践,以保护敏感数据和系统。 • 通过解决硬件、软件和网络问题,为团队成员提供技术支持。 ONE Technology Services 我们专注于人员配置和软件开发服务,包括定制应用开发、定制网页开发、人员扩充、托管和云解决方案、技术招聘和IT咨询。 ONE Technology Services也是一家产品型公司。我们的产品Workshop解决方案和ERP解决方案已经过充分测试,通过精准解决业务问题来解决服务型企业的业务问题。这些产品高度可定制,以满足客户的特定需求。凭借与美国和加拿大顶级公司的20多年行业经验,我们能够准确解决所有客户的业务挑战。