Altana是一个值得信赖的贸易网络。我们的AI驱动产品网络帮助政府和企业建立一个更具韧性和安全性的全球经济,同时保持贸易畅通。
在Altana的机会
云工程团队正在寻找一位经验丰富的云工程师来帮助实现我们的愿景。您将与我们的开发人员、数据科学家和客户密切合作,参与分析和观察全球规模的数据集,构建能够扩展以产生前所未见的洞察力的系统,并构建基础设施和应用程序以帮助实现我们的产品愿景。
在这个角色中,您将对确保Altana关键生产服务在我们的云原生环境和数据管道中的可用性、性能和可扩展性起到关键作用。您将通过自动化、主动监控和全面的可观察性将可靠性注入我们的架构和运营。成功将通过我们生产系统的韧性、我们可观察性堆栈的有效性以及我们在运营效率方面的持续改进来衡量。
您的职责
• 可观察性和监控:设计、实施和维护跨平台堆栈的全面可观察性解决方案,包括使用现代工具(Prometheus、Grafana、Datadog、OpenTelemetry)的指标、日志记录、跟踪和警报。开发仪表板和运行手册,提供对系统健康和行为的深入洞察。
• 内部开发者平台:使用基础设施即代码(Terraform)构建和维护内部开发者平台,以实现跨多云环境(AWS、Azure)的自助服务供应。
• 自动化和CI/CD:设计和实施用于基础设施供应、应用程序部署和操作任务的自动化管道,使用GitLab CI/CD、GitHub Actions或类似工具。
• Kubernetes和容器平台:开发和维护Kubernetes平台,包括编写Helm图表、管理集群操作、实施Pod安全策略和优化资源利用。
• 可靠性工程:倡导SRE原则,包括为关键服务建立和监控服务水平目标(SLO)和错误预算。推动提高系统可靠性、可用性、性能和效率的举措。
• 平台抽象:创建平台抽象和工具,使开发团队能够独立部署和操作服务,同时保持安全性和合规性标准。
• 安全和合规:构建和维护安全的容器镜像和部署管道,具有自动化的安全扫描、漏洞管理和合规检查。支持在高度监管的客户环境中的部署。
• 事件管理:参与事件响应生命周期,包括检测、分类、缓解和解决。领导无责备的事后分析,以确定根本原因并实施预防措施。
• 减少繁琐工作:通过脚本、工具开发和流程改进自动化操作任务,以减少繁琐工作并提高系统可靠性。
• 协作和指导:与工程团队合作,了解他们的需求并将其转化为平台能力。指导团队成员云最佳实践、平台模式和自动化技术。
• 值班轮换:参与定期的值班轮换,响应关键警报并确保快速解决生产事件。
关于您
• 在生产环境中构建开发者平台、基础设施自动化或云基础设施方面有5年以上经验。
• 在设计、实施和管理云原生环境的可观察性平台方面具有专业知识(例如,Prometheus、Grafana、Datadog、ELK堆栈、OpenTelemetry、Jaeger)。
• 对SRE原则的深刻理解和实际应用,包括SLO、错误预算、减少繁琐工作和无责备文化。
• 在AWS和/或Azure中构建和操作环境的生产经验。
• 熟练掌握Terraform、OpenTofu或类似工具的基础设施即代码技能。
• 拥有Kubernetes的实践经验,包括集群管理、应用程序部署和操作维护。
• 熟练掌握至少一种编程/脚本语言(例如,Python、Go)用于自动化和工具开发。
• 参与和改进关键系统事件管理流程的证明经验。
• 了解现代软件交付范式,包括微服务架构和CI/CD管道。
• 在复杂分布式系统中具有出色的问题解决、分析和故障排除技能。
• 优秀的书面和口头沟通能力,能够与技术团队合作以理解需求和设计解决方案。
• 在提高团队生产力或系统可靠性方面交付平台能力的良好记录。
• 深切关心开发者体验、自动化、安全性和运营卓越。
加分项
• 在初创公司或高速增长的科技公司有经验。
• 具有GitOps工作流经验(ArgoCD、Flux)。
• 熟悉信息系统安全和合规框架(FedRAMP、IRAP、SOC 2)。
• 具有服务网格技术经验(Istio、Linkerd)。
• 具有数据工程概念经验,包括构建或操作可靠的数据管道、数据流技术或管理大规模数据基础设施。
• 计算机科学学士或硕士学位,或同等经验。
我们喜爱的技术
• 语言:Python、Go、JavaScript
• 基础设施:Docker、Kubernetes、Terraform、AWS、Azure
• 可观察性:Datadog、Prometheus、Grafana、OpenTelemetry
• 数据:Databricks、OpenSearch、Postgres、Spark
该职位可以完全远程工作,或基于纽约市、华盛顿特区或旧金山湾区,期望根据需要进行混合工作或偶尔出差。
美国薪资范围和福利
$170,000 - $220,000
该职位的薪资范围是在诚意声明的基础上,表示该职位的年度基本薪资的最低和最高水平。提供给成功候选人的基本薪资将取决于广泛的补偿因素,包括但不限于工作经验、教育和/或培训、关键技能和/或业务考虑。在大多数全职报价中包括竞争性股权授予;并被视为Altana总补偿包的一部分。Altana还根据角色提供酌情奖金或可变薪酬计划。此外,Altana为全职员工提供顶级福利,包括:
• 灵活休假:Altana实行灵活休假(FTO)政策,让您可以自主安排自己的休假时间,以最大化工作与生活的平衡。
• 育儿假:我们提供行业领先的带薪育儿假(PPL),为非生育、收养和寄养父母提供14周的假期,为生育父母提供最多26周的假期,全部按您基本工资的100%支付。
• 健康福利:我们提供全套医疗、视力和牙科福利,雇主慷慨贡献,旨在为您的个人健康状况提供灵活性和选择。我们的高免赔额健康计划为员工100%由雇主支付,并通过雇主对您的健康储蓄账户(HSA)的贡献进行补充。还有灵活支出账户(FSA)选项。
• 补充福利:Altana提供人寿、短期和长期残疾以及意外伤害和死亡保险,全部免费,以确保您和您的亲人在紧急情况下得到保障。
• 401(k)储蓄:使用我们的Guideline 401(k)退休储蓄计划为您的未来储蓄和投资。
• 通勤福利:通过预税资金为公共交通或停车设置来节省通勤费用!
• 健康:因为我们重视心理和情绪健康,每位Altana员工都可以免费获得Calm的高级订阅,这是冥想、睡眠和正念的第一应用程序。
• 宠物保险:宠物也是家庭的一员!通过Wishbone保险和/或我们的Total Pet兽医服务和远程健康折扣计划保持它们的健康。
• 员工援助计划:免费获得保密的个人支持。
• 受抚养人护理FSA:您将可以使用受抚养人护理FSA,允许您为儿童护理费用预留税前资金。
分配给该职位的招聘人员可以在招聘过程中分享有关该职位的具体薪酬和福利细节的更多信息。
我们的价值观
我们的价值观是塑造我们是谁、我们代表什么以及我们如何行为的核心信念。它们构成了Altana文化和诚信的基础,并指导我们如何招聘、设计、构建以及与彼此和客户联系。
• 信任:我们的客户和合作伙伴将最高重要性的任务托付给我们。我们通过信守承诺、履行承诺并确保我们采取的每一个行动都增强对我们的信心来尊重这一点。我们依靠彼此来交付、坦诚交流并对自己负责。
• 韧性:在一个充满不确定性和复杂性的世界中,我们的工作必须经受住挑战,随条件演变,并确保长期可靠性。韧性既是我们的操作方式,也是我们交付的内容。这是我们在事情不按计划进行时的反应方式——我们适应、互相支持并继续前进。
• 管理:我们是我们所接触的每个任务的管理者。因为我们的工作影响生活和未来,我们对交付任务影响负责,决不妥协。我们的责任不仅限于单个项目,还扩展到全球贸易的更广泛系统。我们相信管理从内部开始,以便我们能够将专注、创造力和卓越带入我们的工作。我们每个人都对营造一个人们可以茁壮成长的工作场所负有个人责任。我们也是公司更大利益的管理者。通过对自己和彼此负责,我们建立了一个反映我们使命规模的创新和集体成功文化。
• 勇气:勇气是为我们的客户解锁看似不可能的事情的关键价值。它是推动我们大胆行动并解决大而复杂的网络问题的核心价值——那些其他人避免的问题。我们知道成功不是保证的,但我们有大胆的愿景,相信解决方案是可能的并去构建它。勇气推动我们的成长心态。这意味着接受使我们更强大的挑战,并通过我们如何处理艰难对话和复杂项目来展示。
在Altana,我们相信多元化的员工队伍能够带来更大的创造力、表现和适应性。我们自豪地成为一个平等机会的雇主,欢迎您以真实的自我加入我们。我们的就业机会和决策基于业务需求和个人资格,而不考虑种族、肤色、宗教信仰、国籍、祖先、年龄、身体或精神残疾、医疗状况、婚姻状况、性取向、性别认同或表达、遗传信息、家庭护理或医疗休假状态、军人或退伍军人身份,或我们运营地区法律或法规保护的任何其他特征。我们禁止任何类型的歧视和骚扰。
与Altana相关的就业报价将来自Altana.ai电子邮件地址。我们绝不会在面试或入职过程中要求付款。