PubMatic正在立即招聘一名机器学习高级工程师,加入我们在纽约的快速发展团队,采用混合工作安排。
此职位将向可寻址性和市场部的高级副总裁报告,作为资深贡献者,您将开发、实施和扩展用于实时拍卖、广告库存估计和受众分割的数据密集型机器学习软件。
与我们的大数据、广告投放和产品经理合作,您将应用机器学习创建概念验证(Proofs of Concept)。然后,您将带领其他数据科学家将概念验证实施到生产中,并扩展解决方案。
职责
• 设计和实现我们算法的核心组件,并对PubMatic每天产生的大量数据进行建模
• 开发和实施数据密集型机器学习软件,用于实时拍卖、广告库存估计、受众分割和其他AdTech应用
• 与数据科学家、产品经理和软件工程师合作,开发和支持新的机器学习产品的软件
• 确保向内部和外部客户提供卓越的交付结果
资格要求
• 必须拥有STEM领域的博士学位
• 拥有3年以上实际行业工作经验,设计和构建大规模机器学习算法和ETL,这些算法和ETL具有良好的设计、清晰的代码、良好的文档、稳定的运行和及时的交付
• 总共有5年以上的分析工作经验,包括学术研究
混合经验
• Python或R,包括机器学习库(SKLearn、NumPy、caret、e1071),包括CPU/GPU并行化、矩阵代数、向量化、线性规划、lambda编程、面向对象编程
• 至少掌握一个深度学习框架(TensorFlow、PyTorch、Caffe、Theano、Keras等)
了解以下内容
• 研究生统计学和概率(推断、假设检验、p值、方差分析、中心极限定理、大数定律、贝叶斯定理、A/B测试、组合数学、概率密度函数/累积分布函数、联合/条件/边缘密度)
• 向量微积分(梯度、雅可比矩阵、偏导数和积分、优化)
• 线性代数(特征值/特征向量、逆、分解、正交性、多线性)
• 时间序列(ARIMA、GARCH、预测、卡尔曼滤波器)
• 浅层机器学习算法:回归、支持向量机(SVM)、k均值聚类(kMeans)、k最近邻(kNN)、朴素贝叶斯(NB)、隐马尔可夫模型(HMM)、主成分分析(PCA)、非负矩阵分解(NMF)、奇异值分解(SVD)、XGBoost、决策树、集成方法(随机森林)
• 深度神经网络算法:多层感知机(MLP)、循环神经网络(RNN)、长短期记忆网络(LSTM)、卷积神经网络(CNN)、门控循环单元(GRU)
• 机器学习概念:反向传播、超参数调优(贝叶斯优化、网格/随机搜索)、正则化、学习率、优化
• 高级SQL或NoSQL的使用,包括嵌套/连接/聚合查询、存储过程、over partition by、基本统计函数
• 云计算引擎(AWS、Azure、GCP等)、GPU集群上的机器学习、SageMaker、Jupyter
• 出色的沟通能力、与企业文化的契合以及对学习机器学习发展和领域专业知识的自然好奇心
Nice To Have(有以下经验更好)
• 程序化广告和实时竞价经验
• 深度强化学习(贝尔曼方程、MDP、策略优化、信用分配或多智能体)
• 熟练掌握Spark(ML Lib、GraphX)、Hadoop、Kafka、Hive
• Scala、Java、C/C++
• 在顶级期刊或会议上发表STEM论文
• 在Kaggle竞赛中获得高排名
薪酬和福利
基本工资范围:23万美元至26万美元
根据适用法律,上述提供的薪资范围是PubMatic对该职位基本工资的合理估计。实际金额可能会因地点、经验、知识、技能和能力等非歧视性因素而有所变化。除工资外,PubMatic还提供奖金、限制性股票单位和竞争力的福利计划。
返回办公室:PubMatic全球员工已通过混合工作安排(每周3天在办公室工作,每周2天远程工作)回到办公室,旨在最大限度地促进团队和各个职能之间的合作、创新和生产力。
福利:我们的福利计划包括领先组织提供的最佳福利,例如带薪休假计划、带薪假期、医疗保险、牙科保险、视力保险、残疾和人寿保险、通勤福利、身体和财务健康计划、美国境内无限制的休假时间(我们实际上要求您使用!)、移动费用报销,以及每周4天办公室提供的丰富食品。
多样性与包容性:PubMatic自豪地成为一个平等机会雇主;我们不仅仅重视多样性,我们还积极促进和庆祝多样性。我们不以种族、宗教、肤色、国籍、性别、性取向、年龄、婚姻状况、退伍军人身份或残疾身份为由进行歧视。