完整职位描述
业务职能
集团技术与运营(T&O)通过战略性关注生产力、质量与控制、技术、人员能力和创新,为银行提供高效、灵活和弹性的基础设施。在集团T&O中,我们管理大部分银行的运营流程,并通过多个银行交付渠道激发我们的业务合作伙伴的满意度。
工作摘要
新加坡星展银行的站点可靠性工程(SRE)结合软件和系统工程,构建、运行和维护高性能、分布式、容错和弹性的金融系统。站点可靠性工程师专注于确保愉快的客户旅程。
作为一名站点可靠性工程师,您将担任关键任务,确保我们的系统健康、监控、自动化、容错和可扩展。
您将与工程团队紧密合作,不断改进我们的生产服务,促进新产品的快速交付,并减少停机时间。
主要职责:
推动站点可靠性工程议程,提高服务的可用性、可靠性和性能
推动应用程序的可观察性
推动优化运营倡议,例如减少运营负担
与应用团队合作,为其应用程序设置SLI、SLO和错误预算
与企业团队合作,部署SRE增强器/倡议
要求:
关键技能:Unix、Wintel、Apache、JBOSS、IBM WebSphere、IBM IHS、MQ管理、OpenShift和AWS管理
次要技能:数据库管理、网络(DNS、防火墙、GTM/LTM、VLAN)
精通不同操作系统(AIX、LINUX、WINTEL、Solaris),用于日常运维、升级和维护
了解操作系统安全性和加固
了解/具有实际经验的补丁管理
深入了解LVM、SAN分配和文件系统增加,在集群/非集群环境中创建新文件系统
ESXi、vSphere系统管理和支持,包括vMotion、HA、DRS、vCenter Operations Manager、vCenter Service Manager、vCenter Configuration Manager、Site Recovery Manager
管理基于云和基于OpenShift的基础设施部署。管理任务包括资源的配置/取消配置
支持审计和基础设施/网络安全扫描、灾难恢复和安全相关演练
跨平台系统进行容量评估和性能管理
了解中间件组件,如JBOSS、APACHE、WebSphere应用服务器和MQ
了解SSL证书采购流程和更新
了解MariaDB、Oracle和DB2数据库的备份、数据库重启、访问问题、数据库升级支持
对UNIX(AIX/Solaris/Linux)服务器上的SAN配置EMC/Hitachi LUN有很好的理解
管理防火墙、GTM和LTM的配置请求
能够根据要求开发简单/复杂的Shell脚本并进行自动化
在处理业务关键服务的危机呼叫/关键问题方面具有良好的能力
在生产支持、应用支持和基础设施支持的至少两个领域有经验
探索、学习和部署能够帮助公司降低成本或提高运营效率的新技术
出色的故障排除和分析能力
沟通和人际交往能力
能够跨文化工作,并能够全天候工作
我们提供具有竞争力的薪资和福利,并提供支持您发展并认可您成就的动态环境的专业优势。