BC, DevOps 工程师 - 本地云基础设施

温哥华 1天前全职 网络
面议
职位:BC, DevOps 工程师 - 本地云基础设施 BC, DevOps 工程师 - 本地云基础设施 关于 Zoic Studios Zoic Studios 是一家视觉特效公司,在这里,创造力与工程相结合。 我们为电影、电视和互动媒体提供了屡获殊荣的视觉效果,现在我们正在演变我们的基础设施,以满足下一代内容创作的需求。 我们正在从传统的本地计算转型为完全基于本地的云原生架构,使用 Open Nebula 和 Kubernetes 等平台。 这意味着构建可扩展、自动化和安全的系统,以支持大规模渲染工作负载、AI 增强的管道和实时协作,而无需依赖公共云提供商。 如果你是一位在动手环境中茁壮成长的 DevOps 工程师,并希望帮助塑造创意基础设施的未来,我们希望听到你的声音。 一般概述 作为 Zoic 的 DevOps 工程师,你不仅仅是维护系统,你还将帮助发明它们。 我们正在寻找具有解决问题能力的建设者思维的人,能够在复杂环境中茁壮成长,并享受将模糊转化为清晰的过程。 你将在设计和发展我们的本地云平台中发挥重要作用,跨越基础设施、自动化和部署管道,确保我们的系统具有弹性、可扩展性,并针对高性能创意工作流程进行了优化。 你将与跨职能团队合作,解决没有现成解决方案的挑战,并帮助塑造支撑我们艺术家和工程师的技术基础。 如果你好奇、足智多谋,并对构建支持世界级视觉叙事的基础设施感到兴奋,这就是你留下持久影响的机会。 • 主要职责 • 构建和管理虚拟化和云编排平台,包括 Open Nebula 和 Kubernetes • 在本地 Kubernetes 集群中部署和管理容器化工作负载 • 为本地环境设计和实施 CI/CD 管道 • 使用 Ansible、Terraform 和 Packer 自动化配置和供应 • 为内部工具和创意管道构建和维护部署工作流 • 针对 GPU 工作负载和高性能渲染任务优化 Kubernetes • 设置和配置物理基础设施,包括服务器、存储阵列和网络设备 • 管理和支持工作室基础设施中的 Linux 和 Windows 环境 • 使用 Prometheus、Grafana 和 ELK 监控系统健康和性能 • 维护安全的备份、恢复和灾难恢复流程 • 与基础设施、工程和创意团队紧密合作,以支持生产需求 • 为内部使用记录系统、流程和运行手册 • 提供基础设施相关问题的技术支持和故障排除 • 实施安全的数据处理实践,包括加密和访问控制 • 支持符合 MPAA、NIST 和 ISO 标准 所需资格 • 3 年以上 DevOps 或基础设施工程经验 • 在多个发行版中具备强大的 Linux 和 Windows 管理技能 • 在 Kubernetes 方面具有丰富的实践经验,包括集群设置、配置、管理和优化 • 精通基础设施即代码工具(Terraform、Ansible、Packer) • 熟悉 Open Nebula 或其他本地云平台 • 具备物理基础设施设置和配置的经验(服务器、存储、网络) • 具备软件定义网络和 Kubernetes 周围常见网络堆栈的经验。 • 精通脚本语言(Python、Bash) • 理解 CI/CD 原则和管道设计 • 能够在快节奏的创意环境中工作 加分技能 • 具备 GPU 编排和 AI/ML 管道的经验 • 熟悉创意工具(Deadline、Nuke、Houdini、Maya) • 具备容器化 GUI 应用程序或远程应用程序的经验 • 在 VFX、游戏、建筑或科学计算方面的背景 • 对开源或技术社区的贡献 你将学习到的内容 • 如何构建和扩展完全云原生的基础设施,而无需依赖公共云提供商