网络工程师,运营与可靠性

圣弗朗西斯科 3天前全职 网络
2K - 3.5K / 年
关于职位 Fluidstack正在寻找一名网络运营工程师,担任我们某个数据中心园区的区域现场负责人。这是一个混合角色,结合了动手的二级/三级网络运营与现场领导职责。您将成为您所分配的数据中心/园区的现场专家,通过事件响应、故障修复协调和卓越运营来确保网络可靠性。当工作负荷允许时,您可以远程工作,但在部署、复杂故障排除和关键事件时需要现场工作。 这个角色非常适合希望拥有数据中心园区所有权的经验丰富的网络运营人员,同时成为更广泛的运营组织的一部分。您将与运营与可靠性支柱负责人、集中NOC进行一级升级的团队以及包括部署、硬件和数据中心运营在内的跨职能团队紧密合作。成功意味着为您的区域保持高可用性,与现场团队建立牢固的关系,并在团队扩展时成长为区域运营领导。 重点 • 区域运营所有权:作为您所分配的数据中心园区的主要网络运营联系人。负责网络健康,响应从NOC升级的事件,并确保网络结构可靠运行。深入了解您所在区域的网络拓扑、常见故障模式和运营特性。 • 二级以上事件响应:在您的覆盖窗口期间处理从一级NOC升级的网络事件。排除物理和逻辑层的复杂问题,与其他工程师协调以实现24小时覆盖,并推动事件解决。当您是现场主题专家时,领导事件响应。 • 故障修复协调:与现场数据中心运营技术人员协调硬件故障修复活动。管理线路卡更换、光学器件更换、设备故障排除和RMA流程。确保物理基础设施问题得到快速解决,不影响生产工作负载。 • 部署支持:在您所在区域的新数据中心部署和扩展期间提供运营支持。与部署团队合作进行启动活动,验证生产准备情况,并确保从部署到运营的顺利交接。确保新模块无缝集成到运营工作流程中。 • 运行手册执行与改进:执行常见故障场景和维护程序的运营手册。识别手册中的差距,记录经验教训,并向运营支柱负责人提供手册改进反馈。为您所在区域建立运营知识库。 • 跨团队合作:与现场数据中心运营团队、结构化布线供应商和硬件物流合作伙伴建立牢固关系。担任您数据中心园区的网络工程联络人。清晰沟通网络状态、计划维护和运营问题。 • 区域指导:随着区域团队的扩展,指导分配到您数据中心的初级运营工程师。分享运营知识,在事件期间提供指导,并帮助建立区域运营能力。 关于您 • 强大的运营背景:5-8年网络工程经验,具有丰富的动手运营经验。您曾运行生产网络,全天候响应事件,并在压力下调试复杂故障。您了解“工作中”和“生产就绪”之间的区别。 • 数据中心结构专业知识:深厚的现代数据中心网络运营经验,包括EVPN/VXLAN、BGP、CLOS拓扑和高径交换。您能够排除第二层/第三层问题、BGP路由问题、结构配置错误和物理层故障。 • 事件响应卓越:证明了领导事件响应、执行系统故障排除和推动问题解决的能力。在停机期间保持冷静,与利益相关者清晰沟通,并知道何时升级与何时深入挖掘。您曾是其他人在问题出现时联系的人。 • 现场领导能力:您曾是某个现场、数据中心或区域的首选网络人员。您了解如何与现场团队建立关系,协调物理基础设施工作,并在现场环境中代表网络工程。您知道如何在运营环境中完成任务。 • 运营务实:您在完美与进步之间取得平衡。您能够在信息不完美的情况下进行故障排除,在时间压力下做出务实决策,并根据业务影响进行优先排序。您在执行过程中记录并不断改进运营流程。 • 混合工作舒适度:您在远程工作时效率高,但了解数据中心运营有时需要动手操作。您能够适应灵活的时间表,以适应运营需求——有时远程,有时在关键时期现场工作数天或数周。 加分项 • AI/HPC结构运营:具有操作AI/ML或HPC结构的经验,包括RDMA(RoCEv2)、无损以太网(PFC、ECN)或高性能网络。您了解当网络性能直接影响工作负载完成时所需的运营精度。 • 区域/园区运营领导:您曾担任过现场负责人、园区工程师或区域运营负责人。您知道如何在特定地理位置协调团队,同时向集中组织报告。 • 硬件故障修复经验:具有协调硬件维修、RMA和物理基础设施工作的动手经验。您了解数据中心物流、供应商升级流程以及如何与现场技术人员有效合作。 • 可观察性与监控:熟悉网络监控平台、警报系统和遥测收集。您曾使用监控工具主动诊断问题,并调整警报以减少噪音。 • 自动化接触:具备基本的脚本编写或自动化经验(Python、Ansible)用于运营任务。您可能不会编写复杂的自动化,但您了解如何利用工具提高运营效率。 • 24小时覆盖经验:具有在分布式运营团队中工作的经验,采用24小时覆盖模式。您了解如何清晰地交接事件,跨时区沟通运营状态,并与全球团队协调。 薪资与福利 • 具有竞争力的总薪酬包(工资+股权)。 • 符合当地标准的退休或养老金计划。 • 健康、牙科和视力保险。 • 慷慨的带薪休假政策,符合当地标准。 该职位的基本工资范围为每年150,000美元至250,000美元,具体取决于经验、技能、资格和地点。此范围代表我们在发布时对该职位薪酬的诚信估计。总薪酬还可能包括股票期权形式的股权。 我们致力于薪酬公平和透明。 Fluidstack是一个平等就业机会雇主。所有合格的申请者将不分种族、肤色、宗教、性别、国籍、性取向、性别认同、残疾和受保护的退伍军人身份或任何其他受法律保护的特征而获得就业考虑。Fluidstack将根据适用法律考虑具有逮捕和定罪记录的合格申请者的就业。