公司概况
Blue Silo是一家领先的科技公司,专注于为国防、政府和工业部门提供关键任务的企业级软件解决方案。我们构建和部署稳健、安全且可扩展的系统。
为了确保我们已部署系统的持续卓越,我们正在建立一个专门的运营与维护(O&M)服务团队。这个团队对于提供我们高风险客户环境所需的持续性能和支持至关重要,弥合了前沿部署与长期运营成功之间的差距。
职位描述
作为Blue Silo的O&M工程师,您将成为我们新现场运营团队的基石。您负责在敏感和要求高的环境中,维护已部署客户系统的持续健康、性能和稳定性。作为第一道防线,您将管理日常运营、执行部署,并根据严格的客户SLA响应紧急情况。您将在现场自主工作,并获得我们远程开发团队的直接支持,以解决复杂问题。这个角色非常适合那些在关键任务环境中确保系统可靠性并渴望实施现代实践的动手工程师。
职责
1. 核心运营与维护(主要重点)
• 为已部署的客户项目提供现场运营管理和支持。
• 在定义的SLA时间内响应和解决紧急事件和服务请求。
• 执行例行系统维护,包括操作系统/应用程序补丁和健康检查。
• 管理Linux和Windows服务器环境。
• 管理虚拟化平台(如VMware、Hyper-V)。
• 使用Zabbix等工具监控系统健康和性能,主动处理警报。
• 管理Docker容器及其生命周期。
• 使用Veeam或类似工具实施和验证备份和复制作业。
2. DevOps与云支持(增长重点)
• 协助提供和维护云基础设施(AWS、Azure或GCP)。
• 使用脚本(Bash、PowerShell、Python)自动化例行任务。
• 使用Terraform等工具支持基础设施即代码(IaC)的实施。
• 帮助集成和维护云原生工具(如CloudWatch、Azure Monitor)的监控。
• 遵循并改进已建立的CI/CD和配置管理实践。
3. 文档与协作
• 维护程序、配置和事件的详细文档。
• 在客户现场与远程Blue Silo开发团队之间进行升级故障排除的联络。
• 参与值班轮换并贡献于事后事件审查。
必备资格
• 在技术支持、系统管理或相关动手角色方面有丰富经验。
• 在以下方面具有扎实的实践知识和故障排除技能:
• *
Linux和Windows服务器管理。
• 网络配置和协议。
• 虚拟化技术(VMware、Hyper-V)。
• 系统补丁和安全更新。
• 服务监控工具(优先Zabbix)。
• 软件部署流程经验。
• 能够在客户现场独立工作并有效沟通。
• 强大的问题解决能力和系统化的事件管理方法。
优先资格
• 拥有主要云平台(AWS、Azure或GCP)的实际操作经验。
• 熟悉基础设施即代码(Terraform、CloudFormation)和配置管理(Ansible)。
• 精通一种脚本语言(Python、Bash、PowerShell)。
• 具有容器技术(Docker)经验。
• 了解CI/CD管道概念和工具。
我们提供
• 成为我们新O&M服务团队的基础成员的机会。
• 直接参与高风险环境中的部署项目。
• 来自经验丰富的开发团队的支持。
• 具有竞争力的薪酬和福利待遇。
如何申请
请将您的简历和求职信发送至hr@bluesilo.studio,说明您与该职位相关的经验和兴趣。
在主题行中包含“DevOps O&M工程师申请”。