初级站点可靠性工程师 - Hadoop

16个月前全职
Xiaomi Technology

Xiaomi Technology

location 新加坡
unsaved
公司简介: 小米公司成立于2010年4月,并于2018年7月9日在香港联交所主板上市(1810.HK)。小米是一家以智能手机和智能硬件为核心的消费电子和智能制造公司,通过物联网平台连接。 秉承“与用户交朋友,成为用户心中最酷的公司”的愿景,小米不断追求创新、高质量的用户体验和运营效率。公司不懈地以诚实的价格打造出色的产品,让世界上的每个人都能通过创新技术享受更美好的生活。 小米是全球领先的智能手机公司之一。截至2021年第二季度,公司在智能手机出货量方面的市场份额全球排名第二。 职位描述: • 处理优先级事件的故障排除,促进无责任的事后分析,并确保事件的永久关闭。 • 鉴定应用程序模式和分析,以支持更好的服务水平目标。 • 评估当前情况和工作内容,并与各个团队合作,确定基础设施自动化、配置管理、监控、警报等关键领域。 • 不断努力设计和改进检测和响应生产服务故障的流程,并构建预防性解决方案。 • 为服务生成和改进可用性和性能指标。 • 根据需要提供非工作时间支持,并参与数据库集群生产环境的24x7轮班。 职位要求: • 计算机科学、工程或相关领域的学士学位,或等同的实际经验。 • 具有Linux或类Unix操作系统的经验。 • 具有分析和故障排除系统的经验。 • 理解基础设施监控、日志记录、警报、发布和配置管理。 • 具备以下其中一种语言的经验:Python、Go或Shell脚本。 • 具有公共云、AWS和/或Azure的经验。 • 具备维护面向互联网的生产级应用程序的经验。 • 优秀的沟通和解决问题的能力,注重细节。 • 灵活性,能够在非工作时间工作,包括周末和/或假日。