作为一名DevOps和支持工程师,您将在维护和提高Trifork在阿曼部署的解决方案的性能、稳定性和可靠性方面发挥关键作用。您将确保我们的系统顺利运行,部署更新、监控性能、排除故障,并直接与客户互动,以提供卓越的服务和正常运行时间。这是一个结合技术专长和客户关注的实践角色。您将成为一个致力于卓越运营、系统弹性和主动解决问题的协作交付团队的一员。
您的职责
系统维护和监控
确保生产系统的持续正常运行和性能。
监控健康状况、资源使用情况和性能指标。
及时响应警报和事件,以最大限度地减少停机时间。
部署和更新
计划、测试和部署系统更新、补丁和配置。
确保顺利、低干扰的部署。
故障排除和支持
诊断和解决系统、硬件和软件问题。
为内部团队和客户提供技术支持,必要时进行升级。
安全和合规
应用和监控安全最佳实践和漏洞补丁。
确保符合内部和外部安全标准。
文档
维护详细的配置、更新和事件记录。
创建和更新操作手册和程序。
备份和恢复
执行并验证定期系统备份。
维护和执行灾难恢复程序。
客户互动
每天与客户在其场所进行互动。
提供状态更新并支持SLA审查会议。
您将推动的关键结果
系统正常运行时间:保持99.9%以上的可用性。
性能:优化资源利用率和响应能力。
及时更新:保持所有系统的补丁和安全。
事件响应:在定义的SLA内解决优先事件。
安全性:通过所有审计并保持加固的环境。
文档:保持100%的系统文档更新。
理想的候选人简介
计算机科学或同等学历的学士学位。
4年以上相关经验(优先考虑10年)。
对Linux系统和容器化环境有深入了解。
有以下经验:
ElasticSearch、Kafka,最好还有Spring Boot、Flink、MariaDB
DevOps工具如Ansible(优先考虑)
脚本编写(Python)或编程(Java、C、C++、MySQL)
有益的:熟悉网络和DPDK。
较强的故障排除和分析能力。
优秀的书面、口头和演讲能力。
自我激励、积极主动,能够独立工作,同时保持团队导向。