分布式系统工程师,分析型数据库平台

圣弗朗西斯科 4天前全职 网络
面议
关于职位 在Cloudflare,我们的使命是帮助构建一个更好的互联网。如今,公司运营着全球最大之一的网络,为从个人博主到中小企业再到财富500强公司等客户提供数百万个网站和其他互联网资产的支持。Cloudflare在不添加硬件、安装软件或更改代码的情况下,保护并加速任何在线互联网应用程序。由Cloudflare支持的互联网资产的网络流量都通过其智能全球网络进行路由,该网络随着每个请求变得更加智能。因此,它们在性能上有显著改善,并减少了垃圾邮件和其他攻击。Cloudflare被《企业家》杂志评为顶级公司文化榜单,并被《快公司》评为全球最具创新力公司之一。我们意识到人们并不适合整齐的框框。我们正在寻找好奇和富有同情心的个人,他们致力于自我发展和学习新技能,我们准备帮助您实现这一目标。没有建立多元化和包容性的团队,我们无法完成我们的使命。我们根据对他们潜力的评估来招聘最优秀的人,并在他们在Cloudflare的整个期间支持他们。加入我们吧!可用地点:奥斯汀(美国) 关于角色 我们正在寻找经验丰富且高度积极的工程师加入我们的数据组织,帮助构建Cloudflare数据的未来。我们的组织负责整个数据生命周期——从摄取和处理到存储和检索——支持关键日志和分析,为我们的客户提供实时可见性,了解其在线资产的健康状况和性能。我们的使命是赋能客户利用他们的数据来推动更好的业务成果。我们构建和维护一套高性能、可扩展的系统,每秒处理超过十亿个事件。作为我们组织的工程师,您将有机会在我们数据栈的不同部分解决复杂的分布式系统挑战。我们的数据组织由几个关键团队组成,您可以为以下任何领域做出贡献: 数据交付:您将构建和操作我们的分布式数据交付管道,这是一个高吞吐量、低延迟的系统(主要用Go编写),负责从Cloudflare的全球网络摄取、处理和路由大量数据到多核目的地。 分析数据库平台:数据检索:负责构建面向客户的产品,使数据可访问和可操作。这包括开发我们的公共GraphQL API,构建稳健的日志交付解决方案和与客户目的地的集成,并为我们的警报产品做出贡献,使用户能够根据我们的数据平台观察到的日志和指标配置和接收近实时警报。 职责 - 设计、开发和维护跨整个数据生命周期的可扩展和可靠的分布式系统。 - 构建和优化我们高吞吐量数据交付平台的关键组件,以确保数据完整性和低延迟交付。 - 为Cloudflare分析平台开发新的和改进现有的组件,以扩展功能和性能。 - 扩展、监控和维护我们大规模数据库集群的性能,以适应不断增长的数据量。 - 开发和增强我们面向客户的GraphQL API、日志交付和警报解决方案,重点关注性能、可靠性和用户体验。 - 致力于识别和消除我们数据平台中的瓶颈,从简化数据摄取过程到优化查询性能。 - 与Cloudflare的其他团队合作,了解他们的数据需求,并构建解决方案以使他们能够做出数据驱动的决策。 - 与ClickHouse开源社区合作,添加新功能并为上游代码库做出贡献。 - 参与我们下一代数据平台的开发,包括研究和评估新技术和方法。 要求 - 3年以上软件开发经验,涵盖分布式系统和数据库。 - 强大的编程技能(Golang优先),以及对软件开发最佳实践和原则的深刻理解。 - 具有现代可观测性栈的实际经验,包括Prometheus、Grafana,以及对大规模处理高基数指标的强烈理解。 - 对SQL和数据库内部结构有深入了解,包括数据库设计、优化和性能调优的经验。 - 计算机科学的扎实基础,包括算法、数据结构、分布式系统和并发。 - 强大的分析和问题解决能力,愿意调试、排除故障,并了解大规模复杂问题。 - 能够在团队环境中协作工作,并与Cloudflare的其他团队有效沟通。 加分项 - 具有ClickHouse经验者优先。 - 具有数据流技术(如Kafka、Flink)经验者优先。 - 具有开发和扩展API,特别是GraphQL经验者优先。 - 具有基础设施即代码工具(如SALT或Terraform)经验者优先。 - 具有Linux容器技术(如Docker和Kubernetes)经验者优先。