高级大数据和存储平台SRE
地点:德克萨斯州达拉斯
这是一个混合角色,位于G-Research在达拉斯的办公室。
G-Research是欧洲领先的量化金融研究公司。我们聘请全球最聪明的人才来解决金融领域的一些重大问题。我们将这种专业知识与机器学习、大数据和一些最先进的技术相结合,以预测金融市场的走势。
达拉斯办事处于2022年开设,是一个关键的基础设施中心,在先进的环境中使用最新的技术。
职位
大数据和存储工程团队目前位于G-Research的平台即服务(PaaS)功能中。
这两个团队在我们的生态系统中管理各种技术,包括VAST、Dell Isilon和ECS存储设备,以及Hadoop HDFS、Airflow等大数据平台,以及Spark、YARN和Trino等分布式计算框架。
我们正在寻找一位经验丰富的高级可靠性工程师(SRE)加入我们的PaaS功能。您必须在管理和优化复杂的大数据平台和/或尖端存储技术方面有着良好的记录。
我们希望找到一个在确保大规模数据基础设施的稳健性、可扩展性和容错性方面表现出色的人才。您必须全面了解在架构、部署和维护高性能存储解决方案中涉及的复杂性,并具有在大数据生态系统中实施和增强可靠性措施的记录。
这个角色要求具有编排弹性系统、调优存储性能以及实施积极策略以减轻潜在停机和中断风险的实际经验。成功的候选人将通过创新解决方案和最佳实践来推动我们的大数据和存储系统的可靠性、效率和可扩展性。
作为回报,您将在一个注重创新、个人发展和培训的前瞻性公司中接触到最新的硬件和软件技术。
该职位的主要职责包括:
• 领导两个团队之间改进现有实践的努力,促进协作和同步,优化系统的可靠性和可扩展性
• 推动提高系统性能的策略,利用创新方法提高效率和简化流程
• 实施系统可靠性、容错性和可扩展性的最佳实践,确保与不断发展的行业标准保持一致
• 培养持续改进的文化,鼓励定期审查和迭代改进工具、方法和流程
• 通过进行全面审查、实施改进措施并将所学到的经验融入未来战略,改进事故响应流程
• 领导优化容量规划策略的努力,确保系统为未来的扩展做好准备,同时最大限度地利用资源
• 与安全团队合作,加强和增强系统内的安全措施,确保符合不断发展的政策和标准
• 与PaaS中的其他SRE以及不同时区(达拉斯和伦敦)的同事有效合作
我们在寻找谁?
您将是一位经验丰富的平台可靠性工程师,热衷于为自动化、可扩展、可靠且高性能的大数据和存储平台做出贡献。
理想的候选人应具备以下技能和经验:
• 强烈的愿望不断学习新技术、方法和系统的能力,以及在多个团队之间灵活工作的敏捷性
• 熟悉大规模存储系统,包括分布式系统(如HDFS)、对象存储(如Amazon S3)和文件存储系统
• 具备出色的解决问题的能力的自我激励者
• 熟练掌握Python和其他编程语言,如Java、Scala或Go,用于自动化和开发任务
• 精通Linux、网络和基础设施知识
• 具备CI/CD(首选Jenkins和ArgoCD)和配置管理工具(如Ansible和Terraform)的经验
• 具备在Docker和Kubernetes上部署和运行应用程序的经验,包括创建Helm图表
• 熟悉Prometheus、Grafana和ELK堆栈(Elasticsearch、Logstash、Kibana)或类似的监控工具
• 理解核心SRE概念及其在平台工程中的实施
有益的经验包括:
• 熟练使用各种大数据和存储技术,如Hadoop、Spark或类似的分布式计算框架,以及VAST、Isilon或类似的存储设备
• 在AWS、Azure或GCP等云平台上使用大数据和存储解决方案的经验
为什么应该申请?
• 市场领先的薪酬和年度福利金
• 非正式的着装规定和良好的工作/生活平衡
• 优秀的带薪休假津贴
• 病假、军事假期以及家庭和医疗假期
• 丰厚的401(k)计划
• 全薪产假16周
• 医疗和处方药、牙科和视觉保险
• 人身意外伤害和残疾(AD&D)保险
• 员工援助和健康计划
• 丰厚的搬迁津贴和支持
• 多种选择的办公室零食和热饮冷饮
• 健身房和停车场设施
G-Research致力于营造和保持一个包容的工作环境。我们是一个以创意为驱动的企业,非常重视经验和观点的多样性。
我们希望确保申请者获得一个能够使他们发挥最佳水平的招聘体验。如果您有残疾或特殊需求需要提供帮助,请在相关部分告知我们。
申请