作为一名DevOps和支持工程师,您将在维护和提高Trifork在阿曼部署解决方案的性能、稳定性和可靠性方面发挥关键作用。您将确保我们的系统顺利运行,负责部署更新、监控性能、排除故障,并直接与客户互动,以提供卓越的服务和正常运行时间。这是一个结合技术专长和客户关注的实际操作角色。您将成为一个致力于卓越运营、系统弹性和主动解决问题的协作交付团队的一员。
您的职责
系统维护和监控
确保生产系统的持续正常运行和性能。
监控健康状况、资源使用情况和性能指标。
及时响应警报和事件,以最大限度地减少停机时间。
部署和更新
计划、测试和部署系统更新、补丁和配置。
确保顺利、低干扰的部署。
故障排除和支持
诊断和解决系统、硬件和软件问题。
为内部团队和客户提供技术支持,必要时进行升级。
安全和合规
应用和监控安全最佳实践和漏洞补丁。
确保符合内部和外部安全标准。
文档
维护详细的配置、更新和事件记录。
创建和更新操作手册和程序。
备份和恢复
执行并验证定期系统备份。
维护和执行灾难恢复程序。
客户互动
每天与客户在其场所互动。
提供状态更新并支持SLA审查会议。
您将推动的关键结果
系统正常运行时间:保持99.9%+的可用性。
性能:优化资源利用率和响应能力。
及时更新:保持所有系统的补丁和安全。
事件响应:在定义的SLA内解决优先事件。
安全:通过所有审核并保持环境的安全性。
文档:保持100%的系统文档更新。
理想的候选人简介
计算机科学学士学位或同等学历。
4年以上相关经验(优先10年)。
对Linux系统和容器化环境有深入了解。
有以下经验:
ElasticSearch、Kafka,最好是Spring Boot、Flink、MariaDB
DevOps工具,如Ansible(优先)
脚本(Python)或编程(Java、C、C++、MySQL)
有益的:熟悉网络和DPDK。
较强的故障排除和分析能力。
优秀的书面、口头和演示技能。
自我激励、积极主动,能够独立工作,同时保持团队导向。