我们正在寻找一位高技能和积极进取的系统/软件工程师,具备深厚的基础设施自动化专业知识,以及扎实的操作系统、内核和系统编程基础。理想的候选人将负责设计、实施和维护使用基础设施即代码(IaC)工具的自动化基础设施解决方案,以确保在云环境中实现一致、可扩展和高效的IT运营。
主要职责:
1. 基础设施自动化
• 使用IaC工具设计、构建和维护自动化基础设施的配置和供应。
• 确保部署中的一致性、可扩展性和可重复性。
2. 云基础设施管理
• 在AWS、Azure或Google Cloud等云平台上设计和管理安全、可扩展和高可用的基础设施。
3. 配置管理
• 实施和维护配置管理工具,以支持可重复的基础设施部署。
4. 监控与优化
• 开发自动化监控仪表板和警报。
• 优化模板和脚本,以提高性能并减少开销。
5. 故障排除与解决
• 快速有效地诊断和解决复杂的基础设施和自动化问题。
6. 安全与合规
• 应用云安全最佳实践和治理政策。
• 确保遵守组织和行业标准。
7. 协作
• 与开发人员、安全工程师和运营团队协作,提供无缝高效的解决方案。
8. 持续改进
• 持续识别优化基础设施性能、成本和效率的机会。
9. 技术指导
• 提供关于自动化、DevOps和基础设施架构最佳实践的指导和建议。
要求:
• 教育:计算机科学或工程学的学士或硕士学位
• 经验:至少8年的基础设施自动化、云平台、系统编程及相关领域的实际经验。
• 扎实的操作系统、内核和系统编程基础。
• 在复杂环境中设计和管理自动化基础设施解决方案的成功记录。
关键技能和技术:
• 基础设施即代码(IaC):Terraform、Ansible、CloudFormation、ARM模板
• 云平台:AWS、Azure、Google Cloud
• 脚本和编程:Python、Bash
• 配置管理:Ansible、Chef、Puppet
• CI/CD管道:Jenkins、GitLab CI或同等工具
• 网络:VPC、子网、路由、安全组
• 操作系统:Linux、Windows
• 监控与日志记录:CloudWatch、Azure Monitor、Prometheus
• 安全:了解云安全最佳实践、IAM和合规框架
• 协作工具:Jira、Confluence、Slack