关于职位
Abnormal Security正在寻找一名高级机器学习工程师加入消息检测决策团队。在Abnormal,我们保护客户免受不断演变的恶意对手的攻击,这些对手不断改进他们的技术和策略,以躲避和破坏传统的安全方法。这就是我们的新颖基于行为的方法如此“异常”的原因。Abnormal一直被评为顶级网络安全初创公司之一,我们的行为AI系统帮助我们赢得了各种网络安全奖项,并被信任保护超过8%的财富1000强企业(并且还在不断增长)。
在一个单一成功攻击可能导致数百万美元财务损失的环境中,消息检测决策团队扮演着构建极其精确的检测引擎的核心角色,该引擎可以在毫秒级延迟下处理数亿条消息。Abnormal接收的每封电子邮件都会经过检测决策团队拥有的工作流程,该团队根据消息和用户上下文对消息应用数百个信号和检测器。然后,系统计算出系统的最终整体决策,从而记录归因以推动各种离线和在线指标,如离线准确性、在线准确性、在线误报率等。
该团队正在解决一个多层次的检测问题,其中涉及建模通信模式以建立企业范围的基线,将这些模式作为强大的信号,并将这些信号与上下文信息相结合,创建极高精度的系统。团队在各个层面上构建有区分性的信号,包括消息级别(例如特定短语的存在)、发件人级别(例如发件人的频率)和收件人级别(例如接收安全消息的可能性),这为创建高精确度的启发式和模型检测器奠定了基础。此外,为了保持整体高精确度的检测系统,该团队创新的软件系统和流程可以快速适应短期内出现的趋势,并在长期内具有良好的普适性。
这个职位还将有机会对团队的整体使命、方向和增长产生巨大影响。高级机器学习工程师将参与了解在误报领域最紧迫的客户问题,并构建相关的技术路线图,以持续以极高的精确度运行我们的检测决策系统。
你将会做什么
• 设计和实现系统,将规则、模型、特征工程、业务和产品输入结合到电子邮件检测产品中。
• 识别和推荐可以显著提高产品检测效果的新特征组或ML模型方法。与基础架构和系统工程师合作,将信号生产化以供检测系统使用。
• 了解区分安全电子邮件和电子邮件攻击的特征,以及我们的检测器堆栈如何使我们能够捕获它们。
• 成为主要检测流水线和决策数据流的专家,能够在由糟糕的检测器引起的系统性退化情况下进行调试。
• 编写具有可测试性、可读性、边缘情况和错误处理能力的代码。
• 在明确定义的数据集上训练模型,以提高模型对特定攻击的有效性。
• 积极监控和改进消息检测产品攻击类别的误报率和有效性率,通过特征工程、规则和ML建模。
• 分析误报和漏报数据集,对能力差距进行分类,并推荐短期特征和规则想法,以提高我们的检测效果。
• 在堆栈的其他领域做出贡献:构建和调试数据流水线,或在需要时向客户使用我们的工具展示结果。
• 领导团队的中长期路线图,并为团队制定计划和执行策略。
• 指导和培养初级工程师,通过提供高质量的代码审查和设计审查,提高他们的代码质量和ML效果。
• 参与构建全面的检测引擎,包括数据质量、特征工程、模型开发、实验和运维。
必备技能
• 在将业务需求转化为可扩展、易维护系统方面取得成功的记录,偏向于简单但迭代的系统。
• 4+年的生产级ML系统经验-了解现代ML堆栈的支柱以及ML模型的开发、维护和调优过程。
• 使用系统方法调试ML/启发式模型中的数据和系统问题。
• 熟练使用Python和机器学习库,如numpy和scikit-learn。
• 具备数据分析和使用SQL+pandas+spark框架的能力,用于构建数据和指标生成流水线,并回答关于系统有效性或反事实处理的重要问题。
• 独立负责项目或功能的整个生命周期,包括工程设计、开发和部署。
• 与其他利益相关者合作良好-曾与跨职能团队合作推动项目完成。
• 机器学习学术背景(计算机科学或相关领域的学士学位)。
最好具备的技能
• 计算机科学、电气工程或其他相关工程领域的硕士学位
• 具有大数据或统计学经验
• 熟悉网络安全行业
这个职位不是:
• 一个专注于优化现有机器学习模型的角色
• 一个与产品或客户相距两步的研究导向角色
• 一个统计/数据科学与机器学习相结合的角色