云应用支持或SRE

芝加哥 3天前全职 网络
面议
Dice是技术专家在其职业生涯各个阶段的首选职业目的地。我们的客户,纽约科技合作伙伴,正在寻找以下职位。今天通过Dice申请! 必备技能 应用支持和SRE:在云应用程序支持方面至少有2-4年的经验。在专注于可用性/性能的站点可靠性工程(SRE)角色中有经验。 AWS服务:丰富的实践经验,包括:EC2、S3、VPC、Route 53、RDS、CloudFormation、DynamoDB(NoSQL)、Lambda、CloudWatch、IAM、ELB、EBS、ECS、SQS、SNS。 数据库:精通关系数据库、查询和报告。高度优先考虑Snowflake经验。 故障排除:在UI、API和数据流相关问题的故障排除方面有丰富经验。 监控工具:有使用AppDynamics、Grafana或ThousandEyes等工具的经验。 脚本编写和自动化:需要精通Python。具有PowerShell、SQL和JSON的工作经验。 CI/CD和数据操作:熟悉ADO(Azure DevOps)管道框架。具有数据管理、数据工程或数据操作背景。 主要职责:在定义的服务级别协议(SLA)内分级和解决应用支持票据。 执行关键应用/技术问题的识别和解决,包括响应非工作时间和周末的支持电话。 主动识别、管理和记录问题解决方案,并向请求者提供后续沟通。 参与应用的可用性和性能监控。 开发脚本(Python/PowerShell)和自动化工具,以更好地检测、纠正和预防应用问题。 开发和增强监控和警报功能。 执行Caterpillar管理层分配的其他工作职责。 软技能和其他要求: 能够独立工作并主动管理问题解决。 强大的文档编写和后续沟通能力。 作为随叫随到轮班的一部分,需在非工作时间和周末提供支持电话。 必须是本地人或明确愿意自费搬迁,并从第一天起在现场工作(芝加哥或皮奥里亚,伊利诺伊州)。