我们正在寻找一位积极主动的高级C++软件工程师,负责数据引擎。您将有机会直接参与Theseus的开发,这是一个为可组合性而构建的加速器本地数据处理引擎。您将与Voltron Data开发团队密切合作,构建、优化和维护我们的数据执行框架,添加新功能,使其运行更快、更可扩展,甚至为实现PB级规模的引擎做出贡献。
为什么选择在Voltron Data工作?
• 我们追求影响力:我们是一家获得A轮风险投资支持的初创公司,正在组建全球团队,以Apache Arrow为基础构建数据分析的新基础。这个基础将引领数据处理的创新浪潮,充分利用现代硬件提供的速度和效率。
• 我们致力于桥接开源社区:我们是一群在过去15年中推动开源生态系统发展的开源维护者,特别是在C++、Python和R编程生态系统方面。
• 我们正在建设一个多样化、包容性的公司:我们正在创建一个代表性、公平、尊重的工作场所,优先考虑员工的成长。每个Voltron Data的成员都致力于公司的成功,所有声音对塑造组织的未来至关重要。
时间安排:
以下是您在职业生涯中在不同阶段可以预期的大致时间安排。
入职后:
• 花时间了解Apache Arrow、Theseus中使用的计算基元、查询解析器和优化器以及其他基础组件。
• 深入了解数据处理引擎的架构,不同组件之间的相互作用方式以及数据如何在计算图中流动。
• 了解内存管理机制,包括从GPU到主机和磁盘的内存溢出。
• 学习并接受Voltron Data的软件开发文化。
一个月内:
• 对单节点和分布式查询执行进行性能分析,并分析引擎遥测数据,以更好地了解引擎的工作原理和解决分布式引擎问题的方法。
• 深入研究各种分布式关系代数算法,了解它们的工作原理以及如何改进。
• 与团队合作修复错误,实施简单的优化或代码重构项目。
六个月内:
• 构建新的关系代数组件,扩展SQL覆盖范围或DataFrame功能覆盖范围。
• 对资源管理、任务调度和容错等更复杂的引擎组件进行小的改进。
十二个月内:
• 提出并实施引擎的核心架构改进。
• 处理具有挑战性的任务,如面向多语言的用户定义函数、多查询并发和多租户。
• 将引擎与公司其他团队开发的组件和功能集成,提供企业级客户体验。
有用的先前经验:
• 有数据处理引擎或框架的经验
• 有分布式和多线程系统的经验
• 有硬件资源管理的经验,包括内存和线程池
• 有使用SQL和非SQL系统及其计算抽象的经验
• 有C++开发经验,尤其是使用现代C++
• 有为多种类型的硬件(如CPU、GPU)开发的经验
美国薪酬 - 该职位的薪酬范围为171,000.00美元至210,000.00美元。我们有一个全球市场为基础的薪酬结构,根据地点的不同而有所变化。请注意,基本薪酬范围仅供参考,对于收到录取通知的候选人,实际基本薪酬将根据实际工作地点、候选人的技能和经验等因素而有所变化。此职位还有资格获得额外的激励措施,如股权奖励。
福利
• 可在全球150多个国家/地区工作 - 工资和福利
• 无限制休假
• 医疗、牙科和视力保险
• 退休金[仅限美国]
• 家庭办公室预算
• 继续教育预算
我们是一家平等机会雇主,重视公司的多样性。我们不以种族、宗教、肤色、国籍、性别、性别表达、性取向、年龄、婚姻状况、退伍军人状况或残疾状况为由进行歧视。我们将确保为残疾人士提供合理的住宿,以参与工作申请或面试过程,履行基本工作职责,并享受其他就业福利和特权。请联系我们以请求住宿。