概述
站点可靠性工程师(Linux/云基础设施)角色,具备在Linux、分布式系统、脚本编写、数据库、监控、容器、云SaaS集成、消息传递、负载均衡、安全性和事件管理方面的实际经验。
职责
- 提供Linux 7.x及相关基础设施的实际管理。
- 使用面向服务架构、分布式系统和脚本编写(Python、shell)。
- 管理关系数据库(例如,Sybase、DB2、SQL、Postgres)以及应用集成、配置和故障排除。
- 操作可观察性和监控工具:Open Telemetry、Prometheus、Grafana、Splunk、Ansible。
- 管理Web服务器(Apache、Nginx)和应用服务器(Tomcat、JBoss)以进行集成和故障排除。
- 使用Docker容器、Kubernetes和SaaS平台集成。
- 理解消息系统(例如,Kafka)及其在架构中的作用。
- 从实施角度设计和实施负载均衡、Web代理和存储平台(NAS/SAN)。
- 应用基本安全策略以实现安全托管解决方案,包括Kerberos和加密方法(SSL/TLS)。
- 在安全云环境中管理大型基于Web的多层(n层)应用的经验。
- 应用SRE原则并采用适当的工具方法;具备强大的Linux/Unix管理、存储、网络和Web技术知识。
- 有效解决应用问题并管理事件。
- 展示出色的口头和书面沟通能力。
资格
- 拥有Linux 7.x操作系统的高级实际经验(5年以上)。
- 拥有SOA、分布式系统和脚本编写(Python、shell)的实际经验。
- 拥有关系数据库(Sybase、DB2、SQL、Postgres)的经验。
- 接触过工具:拥有Web服务器(Apache、Nginx)和应用服务器(Tomcat、JBoss)的实际经验。
- 拥有Docker、Kubernetes和SaaS平台集成的经验。
- 拥有Kafka和消息技术的经验。
- 从实施角度理解负载均衡器、Web代理和NAS/SAN存储。
- 熟悉安全托管的安全策略、Kerberos、SSL/TLS。
- 在安全云环境中管理大型基于Web的n层应用的经验。
- 对SRE原则和工具有深入了解。
- 在Linux/Unix管理、存储、网络和Web技术方面具有强大的基础设施知识。
- 具备出色的故障排除和事件管理能力。
资历水平
中高级
雇佣类型
合同
工作职能
信息技术
行业
IT服务和IT咨询