概述
IDEMIA是全球身份和安全领域的领导者。我们的使命是创造一个安全简单的未来,其中身份验证是无可争议的,只有你能够断言自己的身份。我们是一家分布式公司,利用最新技术在金融、电信、身份、安全、零售、体育娱乐商业、政府和物联网等私营和公共部门提供世界级产品。我们使用各种技术和方法,为政府机构和技术公司提供优质产品和服务。IDEMIA由来自不同国籍的14,000多名多样化的员工组成,他们讲述着20多种不同的语言。我们的解决方案共同影响着公民和国家的日常生活。在这个不断变化的世界中,保护你的身份至关重要。加入确保一个人-一个身份的团队。
职责
站点可靠性工程(SRE)是一门将软件工程的方面应用于基础设施和运营问题的学科。其主要目标是创建可扩展和高度可靠的软件系统。根据谷歌站点可靠性团队创始人本·特雷诺尔(Ben Treynor)的说法,SRE是“当软件工程师被交付以前所谓的运维任务时发生的情况”。
站点可靠性工程师(SRE)将花费高达50%的时间进行与“运维”相关的工作,如调查和故障排除、事故响应以及维护playbook和其他相关文档。由于SRE管理的系统被期望具有高可用性和自愈能力,SRE应该将其余50%的时间用于开发任务,如改进CI和部署流水线、增强监控能力和保持系统更新。理想的站点可靠性工程师候选人要么是具有良好管理背景的软件工程师,要么是具有部署自动化、编码和DevOps知识的高技能系统管理员。
您将负责以下工作:
• 拥有产品KPI和SLA报告(例如故障)的所有权。
• 产品服务的可用性和性能。
• 升级部署和新补丁安装。
• 故障排除、错误日志分析、报告生成、容量规划等。
• 自动部署到生产环境和较低环境的管理。
作为站点可靠性工程团队的数据库管理员(DBA),您将负责数据库的性能、完整性和安全性。您将参与代表用户出现的数据库操作。您将确保:
• 数据在数据库中保持一致。
• 提供数据安全和恢复管理(确保在紧急情况下可以检索所有数据)。
• 负责数据库备份和恢复方法、数据库访问安全和完整性、物理数据存储设计和数据存储管理。
• 协助选择数据库管理系统并维护数据库性能。
• 参与持续流程改进。
• 下载和安装SQL Server服务包和更新。
• 配置和维护SQL安全控件。
• 根据Microsoft SQL Server最佳实践为系统架构提供建议。
• 在IT经理和系统工程师的协调下,管理数据库备份和恢复以及灾难恢复计划。
• 创建、更改和改进SQL Server代理任务和维护计划。
• 主动监控SQL Server维护任务,及时排查失败的进程,并尽快解决问题。
• 故障排除应用程序运行缓慢和性能差的问题。
• 负责数据库迁移和服务器更新。
• 创建文档和培训常规数据库管理活动,以及对服务器操作人员进行培训。
• 负责将大数据ETL导入SQL Server,并编写和修改SQL Server Reporting Services报告。
• 将SQL Server与企业应用程序集成。
• T-SQL(Transact-SQL)编程执行分配给您的任何额外职责。
资格要求
所需经验
• 至少有6年云基础、高可用解决方案支持经验。
• 至少有6年SRE、DevOps或软件工程经验。
• 网络管理经验。
• 具备Unix/Linux操作系统、CLI和管理经验。
• 拥有AWS和/或Azure云服务的认证或相关经验者优先考虑。
• 数据库管理经验。
• 计算机科学、数学、工程或等同经验的学士/硕士学位。
所需技能
• 对SQL和SQL Server工具的了解。
• 数据库性能和维护经验。
• 对数据库安全、备份和恢复以及性能监控要求有深入理解。
• 熟悉关系型和维度数据建模。
• 对PowerShell和Unix shell脚本编写有经验。
• 有SSAS、SSIS和SSRS经验。
• 日志聚合、报告和监控。
• CI/CD自动化和编排。
• 在支持关键应用的生产环境中有经验。
• 熟悉Java、JVM管理和配置。
• 熟悉SOC-2和FedRamp High等各种安全合规性级别。
• 具备良好的沟通能力,能够向不同的受众阐述技术细节。
• 对Linux和Windows Server基础架构有深入了解。
• 对数据库技术(MySQL、MS SQL、PostgreSQL Oracle、MongoDB)有广泛知识。
• 有云服务(AWS)的先前经验。
加分项
• 了解和使用Splunk的知识和经验。
• 了解和开发考虑可扩展性、可靠性、可扩展性等因素的应用程序的经验。
• 在连续交付工具中使用单元/集成或功能API测试的测试自动化经验。