角色:DevOps负责人(使用Terraform)
经验:12年以上经验
工作地点:100%远程
描述:
- 在软件工程、DevOps或平台工程岗位有8年以上经验,专注于云基础设施自动化。
- APIM管理经验:
- 至少3年以上事件和基于队列的消息平台架构、操作和工程经验(例如,Solace、Kafka、Amazon MSK、IBM MQ、RabbitMQ)
- 具备设计和实施事件驱动微服务和异步通信模式的经验
- 了解核心消息协议(发布/订阅、队列、基于主题的路由)、Solace API(JMS、REST、MQTT)和事件代理配置
- 具备设计和实施事件驱动微服务和异步通信模式的经验
- 理解分布式消息系统中的消费者组、分区、偏移和消息保留策略
- 熟悉网络基础知识,包括防火墙规则、负载均衡和安全消息路由
- 拥有Apache Kafka、RabbitMQ、AWS SQS/SNS和Solace PubSub+等事件流平台的实操经验
要求:
- 具备使用Terraform、AWS CloudFormation和Helm开发和维护基础设施即代码(IaC)的经验。
- 具备设计和构建CI/CD管道的实操经验,集成安全性、测试和最佳实践。
- 精通编程语言(Python、Go或类似语言)和用于自动化任务的脚本语言(Bash和/或PowerShell)。
- 具备在AWS等云平台上构建可扩展、安全和弹性基础设施平台的经验。
- 拥有丰富的AWS服务和容器平台(例如,ECS Fargate、EKS、Lambda、IAM、Secrets Manager)经验。
- 出色的口头和书面沟通能力,能够有效地与技术和非技术利益相关者合作。
- 具备强大的分析和解决问题的能力,能够排除复杂问题。
- 熟悉安全最佳实践,确保符合行业标准和公司政策。
- 工具生态系统:熟练使用CI/CD管道(GitHub Actions、Harness)、工件管理(Artifactory)和监控(Dynatrace、CloudWatch)。
- 事件响应:具备在云环境中进行故障排除、根本原因分析和事后分析的经验。
优先条件:
- 具备设计和管理高可用、可扩展、容错和安全的云基础设施的经验。
- 具备设计和管理多区域/分布式系统以实现高可用性的经验。
- 熟悉可观察性工具(例如,Dynatrace、AWS CloudWatch、OpenSearch、OpenTelemetry)用于监控和警报。
- 拥有生产环境的事件管理、故障排除和事后分析的实操经验。
- 具备使用Terraform构建可重用框架和基础设施即代码(IaC)以及CI/CD以实现自助服务和自动化的经验。
- 具备版本控制系统(Git)和CI/CD管道的经验。
- 能够推动技术讨论并协调跨职能团队以实现目标。
- 拥有指导和指导初级工程师的经验。
- 关注新兴技术,推荐并在适用时实施改进。
- 对持续学习充满热情,并紧跟行业趋势。
Tekhire Solutions是一家世界级的技术公司,专注于客户驱动的解决方案,深入了解客户需求。Tekhire在连接高技能工人与财富500强企业之间架起桥梁方面表现最佳。始终致力于紧跟技术趋势、创新,并通过认证和企业解决方案转变我们的可信赖客户,从而在业务中产生差异。