高级站点可靠性工程师

蒙特利尔 4天前全职 网络
面议
帮助将AI代理引入全球公司。 在未来十年,自治代理将重新定义我们的工作方式。 Botpress允许公司构建和部署超越对话的高级AI代理,进入真正的业务逻辑。 我们的产品今天就可以在各个行业、地区和无限的使用场景中大规模运作。 作为全球增长最快的第三大B2B AI初创公司,我们处于AI革命的前沿,提供最广泛使用的平台,用于复杂的AI代理。 未来的工作是雄心勃勃的。机会难得。我们采取深思熟虑的增长方式:以产品为导向、资本效率高且高度专注。 如果你想为软件中最有意义的平台转变之一构建基础技术,我们正在寻找顶尖人才加入我们。 主要亮点: • 部署了超过100万个AI代理和聊天机器人 • 超过70万平台用户 • 被35%的财富500强公司信任 • 拥有7年的AI解决方案专业知识 关于职位 我们正在招聘一名网站可靠性工程师,以帮助确保我们平台的稳定性、可扩展性和安全性。你将成为产品团队的一员,负责保持我们的服务在现实世界负载下的弹性和性能的系统。 这是一个专注于基础设施可靠性和运营卓越的实践工程角色。你将设计和维护支持Botpress的云系统(例如AWS),重点关注可观察性、正常运行时间和自动化。 你将与工程师密切合作,完善我们如何发布、监控和操作软件——始终关注降低风险和提高速度。这个角色的一部分将包括向不同地区的用户开放网站。 职责 • 设计和维护可扩展的基础设施 • 设计和优化CI/CD管道以确保变更的顺利交付 • 通过高级监控、日志记录和警报提高可观察性 • 负责事件响应并支持工程团队诊断和解决问题 • 构建提高平台可靠性、弹性和正常运行时间的系统 • 在环境和工作流程中执行安全最佳实践 • 使用Terraform或Pulumi等工具管理基础设施代码 • 记录操作程序、灾难恢复计划和系统运行手册 要求 • 3年以上使用Typescript(Pulumi、React for Backstage、Cli工具)的经验 • 5年以上SRE、DevOps或基础设施工程角色的经验 • 深入了解AWS云基础设施和服务(ECS、S3、Lambda、RDS) • 熟悉Linux系统、容器化和编排(例如Docker、Kubernetes) • 精通CI/CD工具、基础设施即代码和自动化脚本 • 熟悉事件管理和网站可靠性原则 • 具有Datadog、Grafana、Prometheus等可观察性堆栈的经验 • 在技术团队中具有很强的沟通和协作能力 • 在生产问题出现时保持冷静和系统化 • 加分项:在快节奏的初创公司或SaaS环境中有过经验 关于Botpress Botpress最近完成了2500万美元的B轮融资。作为一家快速增长的初创公司,我们运行一个精简且创新的团队,依靠AI实现最大的业务影响。在Botpress,每个人都是所有者,带来他们独特的视角和才能。 我们的团队才华横溢且充满激情。我们有意招聘那些渴望、充满激情、才华横溢并渴望在整个职业生涯中学习和成长的个人。 你将加入一个不仅适应AI革命而且引领它的团队。加入我们的团队意味着改变企业AI的未来,并构建将定义下一代业务自动化的技术。 福利 • 在加拿大增长最快的AI初创公司之一工作 • 与才华横溢且充满激情的团队合作 • 4周假期 • 带薪病假和育儿假 • 综合健康、牙科、视力、旅行和人寿保险 • 教育和技能提升资金 • 备货充足的冰箱和橱柜——我们对零食很认真 • 你自己的办公桌——没有“热桌”式的签到系统 • 充满活力的办公室社区,包括每周社交活动