站点可靠性工程师 Linux / 云基础设施

蒙特利尔 2天前全职 网络
面议
概述 站点可靠性工程师(Linux/云基础设施)角色,具备在Linux、分布式系统、脚本编写、数据库、监控、容器、云SaaS集成、消息传递、负载均衡、安全性和事件管理方面的实际经验。 职责 - 提供Linux 7.x及相关基础设施的实际管理。 - 使用面向服务架构、分布式系统和脚本编写(Python、shell)。 - 管理关系数据库(例如,Sybase、DB2、SQL、Postgres)以及应用集成、配置和故障排除。 - 操作可观察性和监控工具:Open Telemetry、Prometheus、Grafana、Splunk、Ansible。 - 管理Web服务器(Apache、Nginx)和应用服务器(Tomcat、JBoss)以进行集成和故障排除。 - 使用Docker容器、Kubernetes和SaaS平台集成。 - 理解消息系统(例如,Kafka)及其在架构中的作用。 - 从实施角度设计和实施负载均衡、Web代理和存储平台(NAS/SAN)。 - 应用基本安全策略以实现安全托管解决方案,包括Kerberos和加密方法(SSL/TLS)。 - 在安全云环境中管理大型基于Web的多层(n层)应用的经验。 - 应用SRE原则并采用适当的工具方法;具备强大的Linux/Unix管理、存储、网络和Web技术知识。 - 有效解决应用问题并管理事件。 - 展示出色的口头和书面沟通能力。 资格 - 拥有Linux 7.x操作系统的高级实际经验(5年以上)。 - 拥有SOA、分布式系统和脚本编写(Python、shell)的实际经验。 - 拥有关系数据库(Sybase、DB2、SQL、Postgres)的经验。 - 接触过工具:拥有Web服务器(Apache、Nginx)和应用服务器(Tomcat、JBoss)的实际经验。 - 拥有Docker、Kubernetes和SaaS平台集成的经验。 - 拥有Kafka和消息技术的经验。 - 从实施角度理解负载均衡器、Web代理和NAS/SAN存储。 - 熟悉安全托管的安全策略、Kerberos、SSL/TLS。 - 在安全云环境中管理大型基于Web的n层应用的经验。 - 对SRE原则和工具有深入了解。 - 在Linux/Unix管理、存储、网络和Web技术方面具有强大的基础设施知识。 - 具备出色的故障排除和事件管理能力。 资历水平 中高级 雇佣类型 合同 工作职能 信息技术 行业 IT服务和IT咨询